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FLAVIVIRIDAE POUR LE CRIBLAGE DE MOLECULES ANTIVIRALES. 

Molecules d'acide nucleique comprenant Ies genes de 
la famille 2 , -5'-oligoadenylate synthetase (OAS) codant 
pour des proteines impliquees dans la resistance a I'infec- 
tion par Ies Flaviviridae, leurs utilisations a des fins diagnos- 
tiques ou therapeutiques; utilisation des produits desdits 
genes pour le criblage de molecules antivirales et, pour 
revaluation de la sensibility a I'infectlon par Ies virus de la 
famille des Flaviviridae, chez I'homme. 



CM 
CM 

CO 
CM 
00 

CM 

DC 
LL 



2823224 

t 

MOLECULES D'ADN COMPRENANT LES GENES OAS, LEURS 
APPLICATIONS ET UTILISATION DES PRODUITS DESDITS GENES 

La presente invention est relative a des molecules d'acide nucleique 
comprenant les genes de la famille 2'-5'-oligoadenyIate synthetase (OAS) codant pour 
des proteines impliquees dans la resistance a I'infection par les Flaviviridae, leurs 
utilisations a des fins diagnostiques ou therapeutiques ; la presente invention est ega- 
lernent relative a 1 'utilisation des produits desdits genes pour le criblage de molecules 
antivirales et, pour revaluation de la sensibilite a I'infection par les virus de la famille 
des Flaviviridae, chez Thomme. 

La famille des Flaviviridae regroupe les virus du genre flavi virus 
responsables de pathologies humaines graves telles que la dengue, la fievre jaune, les 
encephalites transmises par les tiques, l'encephalite japonaise, l'encephalite a West 
Nile et les virus des hepatites C et G. Si les flavivirus sont susceptibles de provoquer. 
une morbidite et une mortalite importantes chez 1'homme, I'infection est generalement 
asymptomatique et seule une fraction des individus infectes developpent une maladie 
grave. 

Les flavivirus sont des petits virus enveloppes. Leur genome est une 
molecule d' ARN monocatenaire de polarite positive d'environ 1 1 000 bases. L'ARN 
genomique est associe a plusieurs copies de la proteine de capside C pour former la 
nucleocapside; elle est entouree d'une enveloppe virale constituee d'une double couche 
lipidique issue des membranes du reticulum endoplasmique (RE) dans lesquelles sont 
ancrees la proteine d'enveloppe E et la proteine de membrane M. L'ARN genomique 
des flavivirus contient un unique cadre de lecture ouvert d'environ 10500 nucleotides 
flanque de deux courtes regions non codantes a ses extremites 5' et 3'. Le genome est 
traduit en une polyproteine d'environ 3400 acides amines qui est le precurseur des 
proteines structurales C, prM (le precurseur intracellulaire de M) et E dans sa partie N- 
terminale et d'au moins sept proteines non structurales (NS) de NS1 a NS5 dans sa 
partie C-terminale. 

De nombreux facteurs semblent intervenir dans la reaction d'un sujet 
a une infection virale : des facteurs viraux pourraient etre responsables de la severite 
de la maladie, alors que la constitution genetique de l'hote (humain ou mammifere 
non-humain) contribuerait a la sensibilite ou a la resistance a I'infection. 
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Des modeles murins ont permis d'etablir T existence d'une resistance 
genetique a Tinfection par les flavivirus. II a ete montre que certaines lignees de souris 
recemment derivees de Tetat sauvage et appartenant aux especes Mus musculus 
musculus ou Mus spretus (Det, BSVR, BRVR, PRJ, CASA/Rk et CAST/Ei) sont 
resistantes a Tinfection par les flavivirus, alors que les lignees consanguines de 
laboratoire les plus courantes qui derivent majoritairement de Tespece Mus musculus 
domesticus , n'y resistent pas (Sangster et al, J. Virol., 1993, 67 : 340-347). 

La resistance est controlee par au moins un locus autosomal 
denomme F/v, localise sur le chromosome 5, chez la souris et trois alleles FIV, FIV et 
Flv mr conferent respectivement la sensibilite, la resistance et la resistance intermediate 
a Tinfection par les flavivirus. En utilisant une souche du flavivirus de Tencephalite de 
la Vallee de Murray et des souris issues du croisement retour de la lignee de souris 
resistante C3H/RV avec les lignees de souris sensibles C3/He ou B ALB/c, le locus Flv 
a ete localise dans une region de 0,9 cM du chromosome 5, chez la souris, entre les 
marqueurs D5MU68 et D5MU242 (G.R. Shellam et al., Rev. Sci. Tech. Off. Epiz, 
1998,17:231-248.). 

En depit de Pexistence de ces modeles murins de resistance 
genetique a Tinfection par les flavivirus, aucun gene cellulaire de mammiferes 
implique dans la resistance a Tinfection par les Flaviviridae n'a encore ete identifie, 
de maniere certaine au niveau moleculaire. C'est pourquoi les Inventeurs se sont 
donnes pour but de pourvoir a des outils, aptes a permettre d'evaluer la sensibilite de 
Thote (humain ou mammifere non-humain) dans certaines infections virales particu- 
lierement graves pour Thomme comme celles provoquees par les Flaviviridae. 

En utilisant un modele experimental mettant en oeuvre une nouvelle 
souche neurovirulente et neuroinvasive du virus West Nile, particulierement virulence 
et denommee ci-apres souche IS-98-ST1, et des lignees de souris resistantes derivant 
de geniteurs sauvages appartenant a Tespece Mus musculus musculus ou Mus spretus, 
croisees en retour avec les lignees sensibles de laboratoire BALB/c ou C57BL/6, les 
Inventeurs ont precise la localisation du locus Flv dans un intervalle de 0,2 a 0,4 cM 
du chromosome 5 de souris, comprenant la famille des genes 2'-5' oligoadenylate 
synthetase (OAS) et ils ont montre que c'est le gene OAS qui confere la resistance a 
Tinfection par les Flaviviridae. Trois isoformes de l'OAS -LI, L2 et L3- ont ete 
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decrites chez la souris (Genbank Data Library n° X55982 [LI], X58077 [2] et M33863 
[L3]). Leurs genes presenters une forte homologie de sequence (plus de 80 %) (figure 
1) avec celui de TO AS p40/p46 humain (Genbank Data Library n° XM-007004 et 
XM-007005) (figure 2). On ne dispose que de peu d'informations sur les formes LI, 
L2 et L3 de l'OAS murin. 

Le systeme 2-5A qui implique la famille des genes OAS et la RNase 
L participe a la defense de l'hote contre une infection virale (Castelli et a!., Biomed. 
And Pharmacother., 1998, 52, 386-390). Le systeme 2-5A est une voie de degradation 
des ARNs intracellulaire (pour revue, Rutherford et ai, N.A.R.,1?91, 9, 1917-1924). 
L'expression des genes OAS est induite par les interferons (IFN). Les IFNs appartien- 
nent a un groupe de cytokines qui induisent un etat anti-viral dans beaucoup de lignees 
cellulaires (Goodbourn et al % J. Gene Virol., 2000, 81, 2341-2364). Les deux iso- 
formes a/p composent les IFNs de type I: ils se fixent sur le meme recepteur et 
provoquent des reponses similaires chez l'hote. Les phagocytes mononuclees et les 
fibroblastes sont respectivement les principaux producteurs d'IFN-a et d'IFN-p mais 
certains types cellulaires peuvent produire les deux isoformes. L'infection virale d'une 
cellule hote induit la production de 1'IFN a/p qui par fixation sur les recepteurs 
• kinases a tyrosine, presents a la surface cellulaire des cellules avoisinantes non infec- 
tees, va induire l'expression de plusieurs especes proteiques qui seront determinants 
dans les defenses anti-virales. Une perte de l'homeostasie calcique des cellules neuro- 
nals, notamment chez le rat, est aussi capable d'induire l'expression des genes de la 
famille OAS (Paschen et al., Neuroscience Letters, 1999, 263, 109-1 12). II a aussi ete 
montre que la proteine C du virus de Fhepatite C active le promoteur de TOAS 
p40/p46 chez Thomme (Naganuma et al, J. Virol., 2000, 74, 8744-8750). 

La molecule OAS produite sous une forme latente devient active en 
interagissant avec une molecule d'ARN bicatenaire. L'OAS active va alors polymeriser 
l'ATP en oligomeres ppp[A2'p]nA[2-5A] qui vont interagir de facon allosterique avec 
la forme normalement latente de la RNase L (84 kda) pour 1'activer. Le site catalytique 
de la RNase L est localise dans sa region carboxy-terminale et des sequence repetees 
de type ankyrine, une region d'homologie aux proteines kinases et un domaine qui est 
predit former un doigt de zinc sont aussi retrouves. La ribonuclease active degrade les 
ARN monocatenaires en les clivant au niveau des motifs riches en UA et UU. 
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Au cours d'une infection virale, la RNase L clive les ARN cellulaires 
de types messagers et ribosomaux comme les ARN viraux monocatenaires, bloquant 
ainsi la progression du cycle replicatif du virus. La RNase L joue aussi un role dans la 
regulation de l'expression des genes des facteurs pro-apoptotiques tels que Box et les 
caspases (Castelli et al, Cell Death and Differentiation, 1998, 5, 313-320 ; Rush et al, 
J. Interferon Cytokine Res.,2000, 20, 1091-1 100). 

Des facteurs capables de reguler la voie OAS ont ete mis en 
evidence. Un inhibiteur de la RNase L murine a ete identifie, RNase I. Cet inhibiteur a 
ete montre moduler la repression du gene MyoD, un facteur de transcription specifique 
aux cellules musculaires (Bisbal et al, Mol. Cell Biol., 2000, 20, 4959-4969). La 
RNase I est aussi induite par le HIV de type 1 et participe ainsi a la diminution de la 
reponse antivirale de la cellule (Martinand et al, J. Virol., 1999, 73, 290-296). 

Trois domaines conserves ont ete identifies dans la 2'-5 5 - oligo- 
adenylate synthetase : une boucle P suivie d'une sequence riche en asparagine 
denommee bolte D et une region riche en lysine et en arginine denommee region KR. 
Des mutants ponctuels de Tun de ces trois domaines de risoforme LI murine (boucle 
P : : K67R, K67M, G62A et G63 A ; boite D : D76N et D78N ; domaine KR : K200R 
et K200M) ont une activite enzymatique tres reduite ou completement abolie 
(Yamamoto et al., J. Interferon Cytokine Res., 2000, 20 : 337-344). 

Les Inventeurs ont mis en evidence des mutations dans la sequence 
nucleotidique des genes OAS chez les souris sensibles a 1'infection par les Flaviviri- 
dae ; ces mutations inactivent le gene OAS. 

Les mutations suivantes, liees a la sensibilite/resistance de 1'hote a 
Finfection par un Flaviviridae ont en particulier ete mises en evidence : 

. deletions dans la sequence codante de risoforme LI des souris 
sensibles C57BL6 (deletion des nucleotides 100 a 102, 221-232 et 576-577 en refe- 
rence a la sequence hOASl humaine ; figures 3 A, 3B et 3C). 

. introduction d'un codon stop premature (figure 3B), responsable de 
la production d'une proteine 2'-5' OAS tronquee inactive, deletee des residus C- 
terminaux (252-364 en reference a la sequence hOASl) (figure 4). 

Au sens de la presente invention, on entend par mutation une 
substitution, une insertion ou une deletion d'au moins un nucleotide d'une region 
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codante ou non-codante. 

Ces elements ont conduit les Inventeurs a mettre au point un modele 
adapte au criblage de molecules aptes a stimuler specifiquement l'activite des genes 
OAS et/ou a la detection des sujets sensibles a une infection par les virus de la famille 
des Flaviviridae et de ce fait mauvais repondeurs a un traitement a P interferon ; la 
mesure de l'activite 2'-5' OAS chez un individu ou un groupe d'individus representa- 
tifs d'une population humaine permet d'evaluer le risque pour cet individu ou cette 
population a developper une forme grave de la maladie (forme aigue mortelle pour les 
arboviroses ou forme chronique pour 1'hepatite C). 

En consequence, la presente invention a pour objet un precede de 
criblage de molecules aptes a stimuler un gene de la famille OAS, caracterise en ce 
qu'il comprend : 

a) la mise en culture de cellules, issues d'un mammifere non-humain 
FW/FW ou FW/FW 

b) Tinduction de l'expression des genes OAS par addition 
d'interferon a ou P ou par un stress calcique, notamment par addition d'EGTA, 

c) la mise en contact desdites cellules avec la molecule a cribler, et 

d) la mesure de l'activite d'un gene OAS, par comparaison avec un 
echantillon temoin. 

Ledit echantillon temoin est notamment constitue par des cellules de 
mammiferes non-humain FW/FW. 

Selon un mode de mise en ceuvre avantageux dudit procede, ledit 
mammifere non humain FW/FW est de preference une lignee de souris resistantes 
derivant de geniteurs sauvages appartenant a l'espece Mus musculus musculus, ou Mus 
spretus ; elles peuvent de maniere encore plus preferee etre croisees en retour avec des 
lignees murines sensibles de laboratoire telles que BALB/c ou C57BL/6, de fa<?on a 
obtenir des lignees dites congeniques. 

Ces lignees pourront etre utilisees dans de multiples experiences 
destinees a analyser les mecanismes de defense de la souris contre les infections 
virales a flavivirus et notamment pour l'analyse de la physiopathogenie de l'infection 
au niveau cellulaire. Elles pourront aussi servir a la mise au point de therapeutiques 
d'un genre nouveau, lorsque les experiences en question necessiteront Tutilisation de 
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lots homogenes cTanimaux ayant tous la meme constitution genetique, afin de 
comparer leur comportement apres infection ou non. Ces animaux, qui par definition 
seront histocompatibles entre eux et avec l'autre congenique permettront de realiser, si 
besoin est, des transferts cellulaires. 

Selon un autre mode de mise en ceuvre avantageux dudit procede, 
ledit gene OAS est un gene autologue. 

Selon un autre mode de mise en ceuvre avantageux dudit procede, 
ledit gene OAS est un gene heterologue. 

Selon un autre mode de mise en ceuvre avantageux dudit procede, 
Tactivite du gene OAS peut-etre mesuree par determination : 

- de la quantite de transcrits OAS par des techniques classiques qui 
en elles-memes sont connues de rhomme du metier {Northern-blot, RT-PCR...), 

- de la quantite de proteines 2'-5'OAS produites, par des techniques 
classiques qui en elles-memes sont connues de rhomme du metier (ELISA, RIA, 
radioimmunoprecipitation, Western-blot..), 

- du niveau d'activite 2'-5 , OAS, par des techniques classiques qui en 
elles- memes sont connues de rhomme du metier, telles que celles decrites dans Witt 
et al., J. Interferon Res., 1993, 13, 17-23 ou 

- des sequences des ARNm ou de 1'ADN genomique, issues des 
genes de la famille OAS : mise en evidence eventuelle de Tune des mutations preci- 
pes. 

La presente invention a egalement pour objet une molecule d'acide 
nucleique de mammifere (humain ou non-humain), caracterisee en ce qu'elle est 
constituee par une sequence d'ADN genomique de 0,2 a 0,4 cM correspondant a un 
locus de resistance a une infection par un Flaviviridae et en ce qu'elle inclut la famille 
des genes OAS selectionnes dans le groupe constitue par les genes OAS sauvages et 
les genes OAS mutes. 

Dans le cas ou les genes OAS sont des genes sauvages, lesdits indi- 
vidus sont resistants a l'infection par un Flaviviridae, dans le cas ou les genes OAS 
sont des genes mutes, ils sont, de preference, inactives ; en consequence, les individus 
porteurs desdites mutations sont sensibles a l'infection par lesdits virus. 
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Selon un mode de realisation avantageux de ladite molecule, elle 
comprend la sequence du marqueur D5MU368 du chromosome 5 de souris. 

La presente invention a egalement pour objet 1'utilisation des mole- 
cules d'acides nucleiques selectionnees dans le groupe constitue par les molecules 
d'acide nucleique telles que definies ci-dessus, les ADNc desdites molecules et les 
proteines codees par lesdites molecules pour le criblage '\t molecules antivirales 
destinees au traitement des infections par les virus de la famille des Flaviviridae. 

Selon un mode de realisation avantageux de ladite utilisation, lesdites 
molecules sont, de preference, des sequences d'ADN genomique des genes de la 
famille OAS, les ADNc desdites sequences et les proteines correspondantes. 

La presente invention a egalement pour objet Tutilisation d'un 
vecteur recombinant comprenant une molecule d'acide nucleique telle que definie ci- 
dessus pour le criblage de molecules antivirales destinees au traitement des infections 
par les virus de la famille des Flaviviridae. 

La presente invention a egalement pour objet Tutilisation de cellules 
contenant un vecteur recombinant comprenant une molecule d'acide nucleique telle 
que definie ci-dessus pour le criblage de molecules antivirales destinees au traitement 
des infections par les virus de la famille des Flaviviridae. 

La presente invention a egalement pour objet 1'utilisation d'un 
mammifere non-humain recombinant comprenant une molecule d'acide nucleique 
telle que definie ci-dessus pour le criblage de molecules antivirales destinees au 
traitement des infections par les virus de la famille des Flaviviridae. 

La presente invention a egalement pour objet l'utilisation d'une 
molecule apte a stimuler un gene de la famille OAS, directement obtenue par le 
procede de criblage tel que defini ci-dessus, pour la preparation d'un medicament 
antiviral, destine a la prevention et au traitement des infections par les Flaviviridae. 

La presente invention a egalement pour objet une molecule d'acide 
nucleique constitute par un ADNc ou une sequence d'ADN genomique issue d'un 
gene de la famille OAS comme medicament destine au traitement des infections par 
les virus de la famille des Flaviviridae. 

La presente invention a egalement pour objet une proteine codee par 
un ADNc ou une sequence d'ADN genomique issue d'un gene de la famille OAS 
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molecule d'acide nucleique, telle que definie ci-dessus. 

De maniere preferee, Iesdits rnammiferes, notamment des souris, 
sont obtenus par injection in ovo (technique classique de Brister et al.) d'une molecule 
d'ADN selon Finvention contenant la region OAS provenant de souris sauvages., 
c'est-a-dire resistantes a Finfection. 

La presente invention a egalement pour objet des rnammiferes non- 
humains recombinants, caracterises en ce qu'ils sont porteurs d'au moins un allele du 
gene OAS inactive. 

On obtient par exemple des souris knock-out pour Fensemble des 
genes OAS, par deletion desdits genes par la technique cre-LoxP (voir Demande WO 
97/06271) 

Outre les dispositions qui precedent, Finvention comprend encore 
d'autres dispositions, qui ressortiront de la description qui va suivre, qui se refere a 
des exemples de mise en ceuvre de Fobjet de la presente invention, ave references aux 
dessins annexes dans lesquels : 

- la figure 1 illustre la structure de la famille des genes OAS murins, 

- la figure 2 illustre la structure de la famille des genes OAS 

humains 

- la figure 3 (A, B et C) represente Falignement de la sequence 
nucleotidique de FADNc des genes OAS des souris sensibles a Finfection par les 
Flaviviridae (C57BL/6) et du gene OAS1 humain, 

- la figure 4 represente Falignement de la sequence en acides 
amines des isoformes LI, L2 et L3 de la 2'-5' OAS des souris sensibles a Finfection 
par les Flaviviridae (C57BL/6) et de Fisoforme p40/p46 humaine, 

- les figure 5A a 5E represented la comparaison de la sequence en 
acides amines des proteines virales de la souche IS-98-ST1 et de la souche New York 
1 999 (NY99 ; Genbank AF 1 9683 5), 

- la figure 6 represente la cinetique de mortalite et la cinetique 
d'apparition des anticorps seriques specifiques chez souris FW/FW (BALB/c) infec- 
tees par la souche IS-98-ST1 du virus West Nile, 

- la figure 7 represente la cinetique de propagation de la souche IS- 
98-ST1 dans le systeme nerveux central des souris sensibles (BALB/c), 
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- la figure 8 represente le protocole experimental utilise pour preci- 
ser la localisation du locus Flv sur le chromosome 5 de la souris et pour etablir une 
lignee congenique B ALB/c F//, 

- la figure 9 represente la carte genetique du locus Flv, determinee a 
partir des souris sensibles, issues du premier croisement en retour entre les lignees 
resistantes (MAI/Pas et MBT/Pas) et les lignees sensibles (C57BL/6 ou BALB/c). Les 
cases blanches represented les alleles BALB/c ou C57B1/6 et les cases noires repre- 
sented les alleles MAI/Pas ou MBT/Pas. 

- la figure 10 represente les haplotypes autour du locus Flv determinant 
la sensibilite ou la resistance aux Flaviviridae, issus du premier croisement en retour 
(BC1) entre les lignees resistantes (MAI/Pas et MBT/Pas) et les lignees sensibles 
(C57BL/6 et BALB/c). Les lignes grisees represented les alleles (BALB/c ou 
C57B1/6) et les lignes noires represented les alleles MAl/Pas ou MBT/Pas, 

- la figure 1 1 represente la carte genetique et la carte physique du 
locus Flv et la position du gene OAS dans ce locus, 

- la figure 12 represente la distribution des alleles Flv chez les souris 
resistantes et sensibles issues du premier croisement en retour (BC1) entre les lignees 
resistantes (MAI/Pas et MBT/Pas) et les lignees sensibles (C57BL/6 et BALB/c), 

- la figure 13 represente la carte physique du clone BAC RP23- 
39M18 de souris sensibles (C57BL/6) sur laquelle figure la position des marqueurs de 
type microsatellite et STS ainsi que la position des genes OAS murins. 

- la figure 14 represente la cinetique d'apparition des antigenes 
viraux dans les cellules Neuro 2a et les neurones primaires de souris sensibles 
(BALB/c) infectees par le virus West Nile (souche IS-98-ST1). 

- la figure 15 represente la mort par necrose des cellules Neuro 2a 
infectees par le virus West Nile (souche IS-98-ST1). 

- la figure 16 represente Tactivite antivirale de l'lFN-oc sur les 
cellules Neuro 2a infectees par la souche IS-98-ST1 du virus West Nile. 

- la figure 17 represente les amorces utilisees pour la detection des 
mutations dans les sequences codantes de risoforme LI des genes OAS des souris 
sensibles C57BL6. 

Exemple 1 : Materiels et methodes 
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1) Souris mises en oeuvre 

- lignees de souris consanguines sensibles F/vVF/v* C57BL6 et 
BALB/c (Janvier). 

- lignees de souris resistantes (FIVIFIV), derivees de souris sauvages 
appartenant a Tespece Mus musculus musculus, MAI/Pas (capturees en Autriche dans 
la region d'lllmitz) et MBT/Pas (capturees en Bulgarie dans la region de General 
Toshevo), Mus spretus (SEG/Pas et STF/Pas) et Mus musculus domesticus 
(WMP/Pas) (F. Bonhomme et al., 1996, The laboratory mouse and its wild relatives, 
« Genetics variants and strains of the laboratory mouse », S.R.M.F. Lyon, S.D.M. 
Brown, Oxford University Press, Oxford, 1577-1596). 

2) Virus 

a) isolement amplification, purification et titration 
Le virus West Nile (WN) a ete obtenu a partir du systeme nerveux 
central d'une cigogne manifestant des troubles neuropathologiques severes en 
septembre 1998, a Eilat (Israel). L'infection de cellule VERO par cet isolat est 
cytolytique et rimmunofluorescence indirecte avec un ascite de souris immun speci- 
fique du virus West Nile est positive a 100 %. Le virus produit sur cellules VERO a 
ete recolte et amplifie sur cellules de moustiques AP61 Despres et al., Virology, 1993, 
196, 209-219). 

Le passage 1 (ou PI) du virus WN sur cellules AP61 a ete recolte 3 
jours apres l'infection ; il possede un titre de 2,5 x 10 8 UFF/ml (Unite Formant Foyer) 
par la technique de titration sur cellules AP61 decrite dans Despres et al. (Virology, 
1993, 196, 209-219). L'inoculum PI du virus WN sur cellules AP61 a ete identifie 
comme la souche IS-98-ST1. 

Un P2 a ete obtenu, a partir de cellules AP61 infectees par la souche 
IS-98-ST1, PI (titre: 6 x 10 7 UFF/ml). L'inoculum P2 de IS-98-ST1 est utilise pour les 
epreuves de sensibilite a T infection virale chez les souris adultes. 

Un inoculum viral P3 de la souche IS-98-STI avec un titre de 5 x 
10 7 UFF/ml a ete produit sur cellules AP61. Une preparation virale hautement puri- 
fiee, obtenue selon le protocole de purification des flavivirions decrit dans Despres et 
al. (Virology, 1993, 196, 209-219) a ete obtenue a partir de 20 boites de 150 cm 2 de 
cellules AP61 recoltees 3 jours apres l'infection par l'inoculum P3 du virus WN 



m • 

2823224 

12 

souche IS-98-ST1 (multiplicity d'infection de 0,4). La souche IS-98-ST1 purifiee en 
gradient de saccharose a un titre final de 2 x 10 10 UFF/mL 

Les ARNs extraits de ce virus purifie sont utilises pour amplifier les 
ADNc correspondant aux proteines virales C, prM et NS1. 

b) Sequencage de TARN viral 

Le genome viral a ete extrait a partir du surnageant de culture des 
cellules VERO infectees de 1'exemple 1 a l'aide du kit " QIAamp Viral RNA " 
(QIAGEN), en suivant les instructions du fabricant. 6 produits RT-PCR chevauchants 
ont ete amplifies a partir de ces ARNs en utilisant les amorces decrites par Lanciotti et 
al. (Science, 199, 286 :2333-). Les extremites 5' et 3' du genome viral ont ete ampli- 
fies a Paide d'amorces synthetisees d'apres la sequence de la souche WN-NY99 
(Genbank n° AF202541). Les ADNc obtenus ont ete purifies par chromatographic 
echangeuse d'ions et precipites dans 2 volumes d'isopropanol. Ensuite les ADNc ont 
ete sequences sur les deux brins en utilisant le kit " Taq Dye Deoxy Terminator Cycle 
Sequencing " (PERKIN ELMER CORP ./APPLIED BIOSYSTEM) et les amorces 
espacees de 400 paires de bases sur le genome viral (Lanciotti et aL, precite). Le 
sequencage a ete realise avec 0,2 pmoles d'ADNc purifie et 30 pmoles d'amorces, en 
suivant le protocole recommande par le fabricant. L'alignement des sequences est 
realise a Taide du logiciel CLUSTAL W. 

La sequence genomique complete de la souche IS-98-ST1 du virus 
West Nile correspond a la sequence SEQ ID NO : 1 . 

L'alignement des sequences en acides amines de la souche IS-98- 
ST1 et de la souche NY99, presentee a la figure 5, montre que la souche IS-98-ST1 
isolee en Israel en 1998 et la souche NY-99 isolee a New York en 1999 sont tres 
proches (divergence de moins de 0,2% au niveau des sequences en acides amines). 

. Cependant, les differences observees dans la souche IS-98-ST1, 
respectivement dans les proteines E (A 51 ), NS1 (N 17 ), NS2A (R, 64 ), NS2B (G 82 , E 83 ), 
NS3 (P 496 , E 52 ,) et NS5 (S 54 , N 280 , A 372 ) sont potentiellement responsables de la neuro- 
virulence et des proprietes neuroinvasives observees avec cette souche et peuvent 
servir de marqueur de virulence du virus West Nile. 

3^ Cellules 

Des neurones primaires, des cellules endothelials et des astrocytes 
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du systeme nerveux central de souris sensibles homozygotes pour l'allele FW [Swiss 
ou BALB/c (Janvier)] et de souris resistantes homozygotes ou heterozygotes pour 
l'allele FW sont isoles d'embryons de 14 jours. Les neurones primaires sont mis en 
culture en milieu Neuobasal (Gibco BRL) supplement^ avec 20% de facteur de diffe- 
rentiation B27, 20 mM de glutamine et 40 mg/1 de gentamycine comme antibiotique. 

Des cellules de neuroblastome murin Neuro 2a (10 4 cellules/cm 2 ) 
sont cultivees en Labtek a 8 chambres (Nunc) en milieu MEM (GIBCO BRL) 
supplement^ avec 10% de serum de veau foetal (EUROBIO) et 1% d'acides amines 
non essentiels (GIBCO BRL). 

Des cellules d'hepatome humain HepG2 (ATCC n° HB8065) sont 
cultivees dans les conditions classiques telles que decrites dans Marianneau et aL, J. 
Virol, 1996, 77, 2547-2554. 

4) Produits 

L' interferon a (INFaA/D) est fourni par la societe Biosource 
(PHC4044) et PEGTA par SIGMA. 

Exemple 2 : Les souris de lignees sauvages et de lignees consanguines de 
laboratoire se differencient par Ieur sensibilite a I'infection par la souche 
neuroinvasive IS-98-ST1 du virus West Nile. 

1) Les lignees de souris sensibles. 

Des souris BALB/c agees de 6 semaines sont inoculees par la voie 
intraperitoneale avec 100 UFF de la souche IS-98-ST1 virus West Nile (UFF:DL50 = 
10), preparee comme decrit a Pexemple 1. 

Ces souris meurent a 100% avec un temps moyen de mortalite de 9 
± 2 jours (figure 6). 

La cinetique de propagation de la souche IS-98-ST1 dans le systeme 
nerveux central de la souris sensible (BALB/c) a ete analysee a partir des extraits de 
cerveau des souris infectes titres sur cellules AP61, selon la technique decrite dans" 
Despres et al. (J. Virol, 1998, 72, 823-829), precite. Les resultats montrent que le 
virus est detecte dans le systeme nerveux central (SNC) murin au 5* mc jour de I'infec- 
tion et la production virale est maximale au 7* mc jour (Figure 7). Au 9 tmt jour de 
I'infection, le virus n'est plus detecte dans le SNC murin (Figure 7). 

La replication du virus WN dans le SNC et les organes peripheriques 
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des souris infectees par la souche IS-98-ST1 est egalement detectee par immuno- 
histologie, selon les protocoles classiques tels que decrits dans Despres et aL, 1998 
(precite)et par hybridation in situ, selon les protocoles decrits a Pexemple 1. 

Les anticorps seriques specifiquement diriges contre les proteines du 
virus WN sont titres par ELISA selon le protocole decrit dans Despres et aL, 1993 
(precite), en utilisant la souche IS-98-ST1 purifie sur gradient de saccharose telle que 
decrite a Texemple 1, comme antigene. Les resultats montrent que les anticorps 
seriques apparaissent au 5 cme jour de l'infection et sont significativement detectes au 
7*°* jour (figure 6). 

2) Les souris de lignees resistantes. 

Les souris des lignees SEG, WMP, STF et MAI qui derivent de 
souris sauvages sont inoculees par la voie intraperitoneal e, avec 1000 UFF (100 
DL50) de la souche IS-98-ST1 preparee selon le protocole decrit a l'exemple 1. 

Contrairement aux souris de laboratoire qui sont sensibles a 
l'infection par la souche IS-98-ST1 et meurent en une dizaine de jours, ces souris 
derivant de souris sauvages sont resistantes a Tinoculation de la souche IS-98-ST1 et 
neanmoins permissives a la replication de la souche IS-98-ST1. En effet, l'infection 
virale des souris derivant de souris sauvages est asymptomatique bien que le virus se 
multiplie in toto comme le demontre la production d'anticorps seriques anti-WN a 
hauts titres ; en ELISA, les titres des serums a la dilution 1:100 pour 10 6 UFF de 
virion purifie IS-98-ST1 sont superieurs a 1 unite de D.O. a 450 nm. 

Les souris resistantes a Tinfection virale sont utilisees pour la 
production de serums immuns specifiquement diriges contre les proteines de la souche 
IS-98-ST1 du virus WN. Trois semaines apres inoculation du virus WN, les serums 
preleves de souris resistantes (0,045 ml par souris) sont melanges, decomplementes 30 
min a 56°C puis dilues au 1:10 dans du DPBS* ( v / v ) supplement avec 0,2% ( v / v ) de 
Serum Albumine bovine (Life Technologies) et 0,05% ( p / v ) d'azide de sodium. Les 
serums dilues sont repartis en 0,2 ml et conserves a -20°C. Les serums immuns diriges 
contre la souche IS-98-ST1 sont utilises aux dilutions finales de 1:500 pour 1'immuno- 
fluorescence indirecte et au 1:1000 pour rimmunoprecipitation des proteines virales 
radiomarquees. 

Exemple 3 : Localisation du locus Flv dans une region de 0,2 a 0,4 cM du 
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chromosome 5 de souris contenant le gene OAS. 
1) Methodes 

a) Modele d'analvse de la resistance a Tinfection par les Flaviviri- 

dae f figure 8) 

Des souris males des lignees resistantes MAI/Pas et MBT/Pas sont 
croisees avec des souris femelles des lignees sensibles C57BL/6 et BALB/c. Les 
souris males de la generation Fl sont croisees en retour avec des souris femelles des 
lignees resistantes C57BL/6 et BALB/c pour dormer une generation de souris de 
premier de premier croisement en retour (BC1). 

Des souris BC1 agees de 5 semaines sont inoculees par voie intra- 
peritoneale avec la souche IS-98-ST1, preparee selon le protocole decrit a I'exemple 1, 
dans les conditions decrites a Texernple 2. 

Les animaux sont observes tous les jours et les taux de mortalite et 
de survie sont determines 14 jours apres l'infection. 

b) genotvpage des alleles Flv 

Les alleles Flv des individus BC1 ont ete cartographies par PCR 
genomique a l'aide d'amorces specifiques de 16 microsatellites du chromosome 5 
(Catalogue Research Genetics) entourant le locus Flv (figures 9-11), selon les 
techniques courantes de biologie moleculaire en utilisant les protocoles standards tels 
que ceux decrits dans Current Protocols in Molecular Biology (Frederick M. 
AUSUBEL,2000, Wiley and son Inc, Library of Congress, USA). 

2) Resultats 

L'analyse de la distribution des alleles Flv chez les souris BC1 
sensibles et resistantes a l'infection par la souche IS-98ST1 montre qu'un allele FIV 
est suffisant pour conferer la resistance a I 'infection (figure 12). Les resultats montrent 
egalement que dans ce modele il existe une correlation parfaite entre le phenotype 
resistant et la presence de Tallele Flv' et une correlation presque parfaite entre le 
phenotype sensible et I'absence de l'allele iW (figure 12). 

Le genotypage des alleles Flv montre que le locus FLv est localise 
dans une region de 0,2 a 0,4 cM contenant le gene OAS1 (figures 9-11). 
Exemple4 : Les souris sensibles a l'infection par les Flaviridae possedent un gene 
OAS mute. 
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1) Methodes 

La sequence genomique du gene OAS des souris sensibles 
(C57BL/6) a ete determinee a partir de la sequence du clone BAC RP23-39M18 
(figure 11) selon les techniques courantes de biologie moleculaire en utilisant les 
protocoles standards tels que ceux decrits dans Current Protocols in Molecular 
Biology (Frederick M. AUSUBEL, 2000, Wiley and son Inc, Library of Congress, 
USA). 

Les ADNc de l'isoforme LI du gene OAS murin ont ete amplifies 
par RT-PCR (kit Titan One Tube RT-PCR; Roche Biochemicals n° 1939 823) et 
sequences par la technique de sequen<?age automatique (Automat) a 1'aide des amorces 
suivantes (voir figure 17) : 

Exon 1 

Fl (SEQ ID NO:9) et Rl (SEQ ID NO: 10) : produit d'amplification 

de 258 pb 

Fl (SEQ ID NO:9) et R2 (SEQ ID NO:l 1) : produit d'amplification 

de 396 pb 

Exon 2 

F2 (SEQ ID NO:12) et R3 (SEQ ID NO:13) : produit 
d'amplification de 297 pb 

F2 (SEQ ID NO: 12) et R4 (SEQ ID NO: 14): produit 
d'amplification de 515 pb 

Exon 3 

F3 (SEQ ID NO: 15) et R5 (SEQ ID NO: 16) : produit 
d'amplification de 288 pb 

F3 (SEQ ID NO: 15) et R6 (SEQ ID NO: 17): produit 
d'amplification de 501 pb 

F4 (SEQ ID NO: 18) et R5 (SEQ ID NO: 16) : produit 
d'amplification de 1 12 pb 

F4 (SEQ ID NO: 18) et R6 (SEQ ID NO: 17): produit 
d'amplification de 325 pb 

Exon 4 
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F5 (SEQ ID NO: 19) et R7 (SEQ ID NO:20) : produit 
d'amplification de 244 pb 

. F5 (SEQ ID NO: 19) et R8 (SEQ ID NO:21) : produit 
d'amplification de 418 pb 

F6 (SEQ ID NO:22) et R7 (SEQ ID NO:20) : produit 
d'amplification de 156 pb 

F6 (SEQ ID NO:22) et R8 (SEQ ID NO:21) : produit 
d'amplification de 340 pb 

2) Rfeultats 

L'alignement de la sequence de TADNc des isoformes LI, L2 et L3 
du gene OAS des souris sensibles (C57BL/6) avec la sequence de 1'ADNc de 
risoforme LI humaine (figure 3A, 3B et 3C) montre que risoforme LI des souris 
sensibles possede 3 deletions (nucleotides 100 a 102, 221-232 ; 576-577) et un codon 
stop premature en phase, situe en position (807-809). 

L'alignement des sequences en acides amines des isoformes des 
isoformes LI, L2 et L3 du gene OAS des souris sensibles (C57BL/6) avec la sequence 
de risoforme LI humaine (figure 4) montre que risoforme LI des souris sensibles 
correspond a une isoforme LI tronquee de la region C-terminale, laquelle region C- 
terminale comprend la sequence conservee RPVILDPADPT qui est impliquee dans 
Tactivite enzymatique de la 2'-5' OAS. De plus, risoforme LI des souris C57BL/6 ne 
possede pas les 4 premiers acides amines GSSG du domaine 
GSSGKGTTLRGRSDADLVYF qui sont impliques dans Tactivite enzymatique de la 
2*-5'OAS. 

Exemple 5 : Modele cellulaire d'etude de l'activite des genes OAS 

1) Infection de cultures primaires et de h'pnees cellulaires par la 
souche IS-98-STI du virus West Nile 

a) Materiels et methodes 
a^ cultures primaires 

Des neurones primaires et des astrocytes du SNC de souris sensibles 
homozygotes pour F allele FW (souris Swiss, Janvier) sont prepares selon les proto- 
coles classiques tels que decrits a l'exemple 1. Les cellules sont infectees par la souche 
IS-98-ST1 a une multiplicity d'infection de 20 UFF par cellule (m.i. de 20). L'effet 
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cytopathique est observe en microscopie optique, la production virale est analysee par 
titration sur cellules AP61 comme decrit precedemment a l'exemple 1 et 1'expression 
des antigenes viraux est analysee par radioimmunoprecipitation a Taide d'un serum 
immun de souris anti-West Nile, selon les protocoles classiques tels que decrits dans 
Duarte Dos Santos et al. (Virology, 2000, 274, 292-308). 

Les resultats montrent que 80% des neurones en culture produisent 
les antigenes viraux : 

- leur profil en gel de polyacrylamide-SDS est presente a la figure 

14A. 

- la production virale est de [3,0 ± 1,5] x 10 6 UFF/ml apres 20 h 
d'infection et de [7,0 ± 0,5] x 10 7 UFF/ml a 40 h. 

- les effets cytopathiques (ECPs) de type necrotique sont observes 
apres 48 h d'infection virale. 

En revanche, les astrocytes du SNC murin ne sont pas permissifs a la 
replication du virus WN souche IS-98-ST1 . 

aj) jignees [ celjulaires 

Des cellules de neuroblastome murin Neuro 2a et des cellules 
d'hepatome humain HepG2, cultivees dans les conditions classiques telles que decrites 
dans Duarte Dos Santos et al. (precite) sont infectees a differentes multiplicity 
d'infection par le virus WN souche IS-98-ST1, prepare comme decrit a Pexernple 1. 
L'effet cytopathique est observe en microscopie optique, la production virale est ana- 
lysee par titration sur cellules AP61 comme decrit precedemment a Fexemple 1 et 
1'expression des antigenes viraux est analysee par radioimmunoprecipitation a Taide 
d'un serum immun de souris anti-West Nile, selon les protocoles classiques tels que 
decrits dans Duarte Dos Santos et al., precite. 

Les resultats montrent que les cellules de neuroblastome murin 
Neuro 2a sont permissives a la replication de la souche IS-98-ST1 du virus WN. Une 
m.i. de 4 est necessaire pour infecter 80% des cellules Neuro 2a en monocouche. La 
production virale est de 10 7 UFF/ml (m.i. de 4) apres 40 h d'infection et la mort 
cellulaire par necrose est massive (Figure 15). La cinetique de production des anti- 
genes majeurs prM, E et NS1 a partir de la polyproteine virale presentee dans la figure 
4B. montre que Ie demi-temps de formation de la glycoprotein d'enveloppe E est 
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d'environ 30 min. La proteine E de la souche IS-98-ST1 semble ne posseder qu'un 
seui residu N-glycanne (figure 14C). 

Les resultats montrent egalement que les cellules d'hepatome humain 
HepG2 sont permissives a la replication de la souche IS-98-ST1 du virus WN. A une 
m.i. de 10, la production virale est de [2 ± 1] x 10 6 UFF/ml apres 48 h d'infection et les 
ECPs sont observes a partir de 72 h. 

2) Analyse de Teffet de PEGTA et de HNFA sur la replication 
du virus West Nile et detection de I'activite des genes OAS 

a) Materiels et cellules : 

L'interferon alpha (INFa A/D) est fourni par la societe Biosource 
(PHC4044) et 1 'agent chelateur EGTA par Sigma.. 

Les cellules Neuro 2a sont cultivees en MEM supplemente avec 
10% de serum de veau foetal (SVF ; Eurobio) et 1% d'acides amines non essentiels 
(Gibco BRL). Les neurones primaires isoles d'embryons de 14 jours de souris 
BALB/c sont mis en culture en milieu Neurobasal (Gibco BRL) supplemente avec 
20% de facteur de differentiation B27, 20 mM de glutamine et de la gentamycine 
comme antibiotique. 

b) Protocoles d'infection et de traitement des cellules neuronales 
par TINF-q et PEGTA : 

- Infection par la souche IS-98-ST1 du virus WN : 
Les cellules Neuro 2a (10 4 cellules/cm 2 ) cultivees en Labtek a 8 
chambres (Nunc) sont infectees avec la souche virale avec une multiplicite d'infection 
de 4 (cycle unique de replication) ou 0,1 (cycle replicatif biphasique) Unites Formant 
Foyer (UFF ; titre viral obtenu sur cellules de moustiques AP61) par cellule dans du 
MEM supplemente avec 0,2% de serum albumine pendant 90 min a 37°C. Les cellules 
infectees sont incubees avec du MEM a 2% SVF. 

Les neurones primaires de souris BALB/c (# 2,5 10 5 cellules/cm 2 ) 
deposes sur Labtek a 8 chambres (Nunc) sont infectes avec la souche virale avec une 
multiplicite d'infection de 20 UFF par cellule dans du milieu Neuobasal avec 2% SFV 
pendant 90 min a 37°C. Les cellules infectees sont incubees avec du milieu Neuobasal 
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avec 2% SFV et 20% B27. 

- Traitement des cellules infectees par lTNF-a 

Les tapis cellulaires sont laves 3 fois avec du milieu non supple- 
ment puis traites avec 20 Ul/ml (cellules Neuro 2a) ou 100 Ul/ml (neurones 
5 primaires) d'INF-a qui sont additionnes dans le milieu de culture. 

- Traitement des cellules infectees par l'EGTA 

Les monocouches cellulaires sont lavees 3 fois avec du PBS deplete 
en calcium et magnesium (Gibco BRL) puis incubees dans une solution EGTA a 
1 mM dans du PBS pendant 150 min a 37°C Les cellules Neuro 2a sont ensuite incu- 
10 bees dans du MEM supplement^ avec 10% SVF et les neurones primaires dans du 
milieu Neurobasal avec 20% de B27. 

- Preparation des sondes OAS murines 

Les neurones primaires de souris BALB/c traites par 20 Ul/ml 
d'INF-a pendant 12 h sont lyses par la solution de lyse du kit ATLAS™ Pure Total 
15 RNA Labeling System (Clontech, # PT3231-1) et TARN total extrait est precipite avec 
3 volumes d'ethanol 95% en presence de 0,2 M LiCl pendant 18 h a -20°C Un aliquot 
de TARN total (0,5 jig) est utilise comme matrice pour la synthese par la technique 
RT-PCR (kit Titan One Tube RT-PCR; Roche Biochemicals n° 1939 823) des sondes 
OAS a l'aide des amorces OAS-1 a OAS-4 suivantes : 
20 OAS-1 : GTCAGACGCTGACCTGGTG (SEQ ID NO :5, positions 

257-275 ; transcrit L3, [M33863]) 

OAS-2 : AGCTTCTCCTTACACAGTTGG (SEQ ID NO :6, 
positions 686-707 ; transcrit L3, [M33863]) 

OAS-3 : ACAGTGCAGGTGTGTGAGC (SEQ ID NO :7, positions 
25 1379-1398 ; transcrit L2, [X58077]) 

OAS-4 : TCATGTCTCAGAAAGGAAAC (SEQ ID NO :8, 
positions 1854-1874 ; transcrit L2, [X58077]) 

Le couple d'amorces OAS-1 et OAS-2 a ete selectionne afin 
d' amplifier une region de haute identite nucleotidique entre les 3 transcrits OAS (LI, 
30 L2 et L3) qui ont ete identifies chez la souris. Le couple d'amorces OAS-3 et OAS-4 a 
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ete dessine dans la region 5' non codante specifique au transcrit L2. Les produits RT- 
PCR sont clones a Faide du TOPO TA cloning (Invitrogen). 

Les ARN totaux de neurones primaires de souris BALB/c, non 
traites, traites avec 1'INF-a ou I'EGTA, ou infectes par le virus WN en presence ou 
non de FINF-a ou de TEGTA seront hybrides avec les sondes OAS en Northern blot. 
- Activite anti-virale de FINF-a sur le virus West Nile 
Apres induction par 1'IFN-a, trois transcrits des genes OAS, LI, L2, 
L3 sont observes (Rutherford et ai, 1991). Le transcrit L3 est detecte des 4 h post- 
induction, L2 est observe a 12 h post-induction et enfin LI est observe apres 18 h 
post-induction. 

La concentration d'INF-a 20 IU/ml pour les cellules Neuro 2a 
n'altere pas la viabilite cellulaire sur 24 h. 

Les cellules Neuro 2a infectees par le virus WN sont incubees avec 
riNF-a (voir §2) d'une part des le debut de F infection ou d'autre part apres 5 h ou 10 
h defection. Ces temps d'incubation avec FIFN-a ont ete selectionnes en fonction 
d'une part des cinetiques de transcription des genes OAS LI, L2 et L3 et d'autre part 
de la cinetique de replication virale. 

L'addition de TIFN-cc des le debut de Tinfection virale reduit de 
85% (m.i. de 4) le nombre total de cellules Neuro 2a positives en antigenes viraux par 
immunofluorescence indirecte a 24 h post-infection. L' addition de FIFN-a a 5 h post- 
infection reduit de 65% (m.i. de 4) le nombre total de cellules Neuro 2a positives en 
antigenes viraux par immunofluorescence indirecte a 24 h post-infection. L'addition 
de FIFN-a a 10 h post-infection reduit de 50% (m.i. de 4) le nombre total de cellules 
Neuro 2a positives en antigenes viraux par immunofluorescence indirecte a 24 h post- 
infection. 

-Activite anti-virale de VEGTA sur le virus West Nile 

L'incubation de neurones primaires de rat dans un milieu sans 
calcium supplements avec 1 mM de F agent chelateur EGTA pendant 150 min 
provoque une augmentation de 350% du niveau transcriptionnel du (ou des) membres 
de lafamille OAS. 

Le pre-traitement des neurones primaires de souris BALB/c avec 1 
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mM EGTA pendant 2 h 30 (voir §3) reduit de 50% le nombre total de cellules 
positives en antigenes viraux par immunofluorescence indirecte a 24 h post-infection. 
Le traitement des neurones primaires de souris BALB/c avec 1 mM EGTA pendant 2 
h 30 apres 2 h d'infection reduit de 50% le nombre total de cellules positives en anti- 
genes viraux par immunofluorescence indirecte a 24 h post-infection. Le traitement 
des neurones primaires de souris BALB/c avec 1 mM EGTA pendant 2 h 30 apres 6 h 
d' infection reduit de 20% le nombre total de cellules positives en antigenes viraux par 
immunofluorescence indirecte a 24 h post-infection. 



* 
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REVENDICATIONS 
1°) Precede de criblage de molecules aptes a stimuler un gene de la 
famille OAS, caracterise en ce qu-'il comprend : 

a) la mise en culture' de cellules, issues d'un mammifere non-humain 
5- Flv7FlvouFlv7Flv s 9 

b) Pinduction de 1'expression des genes OAS par addition 
d'interferon a ou (5 ou par un stress calcique, notamment par addition d'EGTA, 

c) la mise en contact des cellules avec la molecule a cribler, et 

d) la mesure de l'activite d'un gene OAS, par comparaison avec un 
10 echantillon temoin. 

2°) Procede selon la revendication 1, caracterise en ce que ledit 
mammifere non humain FhffFW est de preference une lignee de souris resistantes 
derivant de geniteurs sauvages appartenant a Tespece Mus musculus musculus ou Mus 
spretus. 

15 3°) Procede selon la revendication 1 ou la revendication 2, caracte- 

rise en ce que lesdites souris resistantes sont croisees en retour avec des lignees 
sensibles de laboratoire. 

4°) Procede selon la revendication 1 ou la revendication 2, caracte- 
rise en ce que ledit gene OAS est selectionne dans le groupe constitue par les genes 
20 autologues et les genes heterologies. 

5°) Procede selon Tune quelconque des revendications 1 a 4, carac- 
terise en ce que l'activite du gene OAS peut-etre raesuree a l'aide de Tune des 
methodes suivantes : determination de la quantite de transcrits OAS, determination de 
la quantite de proteines 2'-5 , OAS produites, determination du niveau d'activite 2*- 
25 5'OAS ou determination de la sequence des ARNm ou de l'ADN genomique issues 
des genes de la famille OAS. 

6°) Molecule d'acide nucleique de mammifere, caracterisee en ce 
qu'elle est constituee par une sequence d'ADN genomique de 0,2 a 0,4 cM corres- 
pondant a un locos de resistance a une infection par un Flaviviridae et en ce qu'elle 
30 inclut la famille des genes OAS selectionnes dans le groupe constitue par les genes 
OAS sauvages et les genes OAS mutes. 
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7°) Molecule d'acide nucleique selon la revendication 6, caracterisee 
en ce qu'elle comprend la sequence du marqueur D5MH368 du chromosome 5 de 
souris. 

8°) Utilisation des molecules decides nucleiques selectionnees dans 
5 le groupe constitue par les molecules d'acide nucleique selon la revendication 6 ou la 
revendication 7, les ADNc desdites molecules et les proteines codees par lesdites 
molecules pour le criblage de molecules antivirales, destinees au traitement des infec- 
tions par les virus de la famille des Flaviviridae. 

9°) Utilisation selon la revendication 8, caracterisee en ce que 
10 lesdites molecules sont des sequences d'ADN genomique des genes de la famille 
OAS, les ADNc desdites sequences et les proteines correspondantes 

10°) Utilisation d'un vecteur recombinant comprenant une molecule 
d'acide nucleique selon la revendication 6 ou la revendication 7 ou une molecule 
d'acide nucleique telle que definie dans les revendications 8 ou 9 3 pour le criblage de 
15 molecules antivirales destinees au traitement des infections par les virus de la famille 
des Flaviviridae. 

11°) Utilisation de cellules contenant un vecteur recombinant com- 
prenant une molecule d'acide nucleique selon la revendication 6 ou la revendication 7 
ou une molecule d'acide nucleique telle que definie dans les revendications 8 ou 9, 
20 pour le criblage de molecules antivirales destinees au traitement des infections par les 
virus de la famille des Flaviviridae. 

12°) Utilisation d'un mammifere non-humain recombinant compre- 
nant une molecule d'acide nucleique selon la revendication 6 ou la revendication 7 ou 
une molecule d'acide nucleique telle que definie dans les revendications 8 ou 9, pour 
25 le criblage de molecules antivirales destinees au traitement des infections par les virus 
de la famille des Flaviviridae. 

13°) Molecule d'acide nucleique constituee par un ADNc ou une 
sequence d'ADN genomique issue d'un gene de la famille OAS comme medicament 
destine au traitement des infections par les virus de la famille des Flaviviridae. 
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14°) Proteine codee par un ADNc ou une sequence d'ADN 
genomique issue d'un gene de la famille OAS comme medicament destine au traite- 
ment des infections par les virus de la famille des Flaviviridae. 

15°) Procede devaluation de la sensibilite d'un individu a 
5 l'infection par un virus de la famille des Flaviviridae et/ou de sa reponse a un traite- 
ment par F interferon, caracterise en ce qu'il comprend : 

- la mise en culture de cellules a partir d'un echantillon d'un individu, 

et 

- Finduction de Fexpression des genes OAS par addition 
10 d'interferon a ou (3 ou par un stress calcique, notamment par addition d'EGTA, et 

- la mesure de Factivite d'un des genes OAS, par comparaison avec 
un echantillon de cellules, obtenues a partir d'un sujet temoin resistant a l'infection. 

16°) Reactifs utiles pour mettre en oeuvre les procedes selon les 
revendications 1 a 5 ou 15, caracterises en ce qu'ils sont selectionnes dans le groupe 
15 constitue par les amorces de sequences SEQ ID NO :5 a 22 ainsi que les sondes 
correspondant respectivement aux positions 257-707 du transcrit de Tisoforme L3 
murine et aux positions 1379-1874 du transcrit de risoforme L2 murine (SEQ ID 
NO:31-32). 

17°) Cellules eucaryotes transformees, caracterisees en ce qu'elles 
20 comprennent une molecule d'acide nucleique de mammifere selon la revendication 6 
ou la revendication 7 ou une molecule d'acide nucleique telle que definie dans les 
revendications 8 ou 9. 

18°) Mammiferes non-humains transgeniques, caracterises en ce 
qu'ils incluent au moins une copie d'une molecule d'acide nucleique, selon la reven- 
25 dication 6 ou la revendication 7 ou une molecule d'acide nucleique telle que definie 
dans les revendications 8 ou 9. 

19°) Mammiferes non-humains recombinants, caracterises en ce 
qu'ils sont porteurs d'au moins un allele du gene OAS inactive. 



• 
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Sequence 1 : hOASl JC02874_ 1322 pb 

Sequence 2 : L3J433863_ 1412 pb 

Sequence 3 : L2JC58077_ 1413 pb 

Sequence 4 : L1_M55982_ 902 pb 

AJignement 

Sequences (3:4) alignees Score : 79 

Sequences (1:2) alignees Score : 59 

Sequences (2:3) alignees Score : 97 

Sequences (1:3) alignees Score : 58 

Sequences (2:4) alignees Score : 79 

Sequences (1:4) alignees Score : 62 

Groupe 1 : sequences : 2 Score : 26287 

Groupe 2 : sequences : 3 Score : 14385 

Groupe 3 : sequences : 4 Score : 15936 

Score d'alignement 36139 

L3_M3 3863_ (SEQfDNO:23 > CCAGGCTGGGAGACCCAGGMGCTCCAGACTTAGCATGGAGCACGGACrCAGGAGCATCC 
L2_X58077_ (SEqidno:25) CCAGGCTGGGAGACCCAGGAAGCTCCAGACTTAGGMGGAGCACGGACTCAGGAGCATCC 
L1J455982_ (SEQIDN0 27 UCCTGCTGGC7GCAGAGGTA^ 

hOASl_X02874_ (SEqidno:29) - -GAGGCAGTTCTGTTGCCACrcrCTCTCCrGTCAATGATGGATCTCAGAAATACCC 

*• * * m m mm mm m m mm 

L3.M33863. CAGCCTGGACGCTGGAGWGTTCATAGAGGATTACCTCCITCCCGACACCACCrTTGGTG 

12_X5S077_ CAGCCTGGACGCrGGACAAGTTCATAGAGGATTACQCCTTCCCGACACCACCTTTGGTG 

ll_M559S2_ CGGCCrCGMGCTTGATAAGTTCATAGAGMC(>TCrCCr--CGGACACCAGCTTCTGTG 

hOASl_X02874_ CAGCCAAATCTCTGGACAAGTTCATTGAAGACTATCrGrTGCCAGAG^CGTGTTTCCGCA 

* mmm mm mm mmmmmmmm mm m m mmm m *»*«» -mm m 

L3J*33363_ CTGATGTCAAATCAGCCGTGMTGTCGTGTGT^^ 

12_JCS8077_ CTGATGTCAAATCAGCCGTC^TtrrCGTGTGTGATTTCCTGAAGGAGAGATGCTTCCAAG 

LlJ455r3Z_ CTGACCTCAGAGAAGTCATAGATGCCCTGTGTGCrCTCCTGAAGGACAGATCCTTCCGGG 

hOASl_X02374_ TGCAAATCGACCATGCCAT7GACATCATC7G7GGGT7CCTGAAGGAAAGGTGOTCCGAG. 

* ** m m. m m mm mmmm - * « ***** * 

L3_M33863_ GTGC7GCCCACCC4GTGAGGGTCTCCAAGGTG<rrGAAGGGTGGCTCCTCAGGCAAAGGCA 

L2_X58077. GTGCrGCCCACCCAGTGAGGGTCTCCAAGuTGGTGAAGGGTGGCTCCrCAGGCAAAGGCA 

L1_M55982_ GCCCCGTCCGCCGAATGAGGGCCTCrAAAGuGGTCAfiGG(r-V"- - - - - r - r.--<AAAGGCA 

hOA5l_X02874_ GTAGCrCCTACCCTGTGTGTGTGTCCAAGGTGGTAAXGGGTGGCrCCTCAGGCAAGGGCA 

• * ** mm m m mm mm m mmm ***** *** **** 

L3J433863_ CCACACTCAAGGGCAGGTCAGACGCTGACCTGGTGCTGTTCCTTAACAATCTCACCAGCT 

L2J(58077_ CCACACTCAAGGGCAAGTCAGACGCTGACCTGGTGGTC7TCCT7AACAATCTCACCAGCT 

ll_M55982_ CCGCGCTCAAGGGCAGGTCAGACGCTGACCTGGTGGTGTTCCTTAACAATCTCACCAGCT 

hOASl_X02874_ CCACCCTCAGAGGCCGATCTGACGCTGACCTGCTTGTCTTCCTCAGTCCT CT CACCACTT 

** * **** «** ** mmmmmmmmmmmmmm mm ***** * ******** * 

L3_>63863_ TTGAGGATCAGTTAAACCGACGGGGAGAGTTCATCAAGGAAATTAAGAAACAGCTGTACG 

L2_X58077_ TTGAGGATCAG7TAAACCGAC GGGGAGAGTT CATCAAGGAAATTAAGAAACAGCT CTACG 

Ll_M55982_ TTGAGGATCAGTT AAACCAACAGGGAGTGTTGATTAAGGAAATTAAGAAACAGCTGTGCG 

hOASl_X02874_ TTCAGGATCAGTTAAATCGCCGGGGAGAGTTCATCCAGGAAATTAGGAGACAGCTGGAAG 



L3_M33863_ AGGTTCAGCATGAGAGACGTTTTAGAGTCAAGTTT gaggtccagagttcatggt ggccca 

L2_X58077_ aggttcagcatgagagacgttttagagtcaagtttgaggtccagagttcatggtggccca 

ll_M55982_ AGGTTCAGCATGAGAGACGTTGTGGAGTGMGTTTGAGGTCCAC^GTTTAAGGAGTCCCA 

hOASJLX02874. CCTGTCAAAGAGAGAGAGCACTTTCCGTGAAGTTTGAGGTCCAGGCrCCACGCTGGGGCA 



** ************** 



13_M33863_ ACGCCCGGTCTCTGAGCTTCAAGCTGAGCGCCCCCCATCTGCATCAGGAGGTGGAGTTTG 

L2_X58077_ ACGCCCGGTCTCTGAGCTTCAAGCTGAGCGCCCCCCATCTGCATCAGGAGGTGGAGTTTG 

L1J*55982_ ACrCCCGGGCTCTGAGCTTCAAGCTGAGCGCCCCCGACCTGCTGAAGGAGGTGAAGTTTG 

hOA51_X02874_ ACCCCCGTGCGCTCAGCTTCGTACTGAGTTCGCTCCAGCrCGGGGAGGGGGTGGAGTTCG 



** **** * ** ***** 



FIGURE 3A 



L3_M33863_ 
L2_X58077_ 
U_M55982_ 
hOASl_X02874. 



-13_M33863_ 
L2JC58077_ 
L1_M55982_ 
hOA5l_X02874. 



L3_M33863_ 
L2_X58077_ 
L1_M55982_ 
hOASlJ(02874. 



L3_M33863_ 
L2_X58077_ 
L1_M55982_ 
hQASUC02874. 



L3_M33863_ 
L2_X58077_ 
L1J455982_ 
hOASl-X02874. 



13_M33863_ 
L2_X58077_ 
Lt_M55982_ 
hOASlJ(02874_ 



L3_M33863_ 
L2_X5S077_ 
L1_M55982_ 
hOASl_X02874_ 



L3_M33863_ 
L2_X58077_ 
LUM55982_ 
hOASUX02874_ 



L2_X58077_ 
L1_M55982_ 
hOASl_X02874_ 



13__M33863_ 
L2_X58077_ 
L1_M55982_ 
hOASl_X02874_ 



L3_M33863_ 
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ll_M55982_ 
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ATGTGCTGCCAGCCnTGATGTCCTGGGTCATGTTAATACTTCCAGCAAGCCTGATCCCA 
ATGTGCTTCCAGCCTTTGATGTCCTGGGTCATGGTAGTATCAATAAGAAGCCTAATCCCT 
ATGTGCrGCCAGCCTATGATTTACrGGATCATCTTAACATCCTCAAGAAGCCTAACCAAC 
ATGTGCrGCCrGCCTTTGATGCCCrGGGTCAGTTGACTGGCAGCTATAAACCTAACCCCC 
******* ** **** **** **** *** * ** *** * * 

GAATCTATGCCATCCrCATCGAGGAATGTACCTCCCTGGGGAAGGATGGCGAGTTCTCTA 
TAATCTACACCATCCTCATCrGGGAATGTACCrCCCrGGGGAAGGATGGCGAGTTCrCTA 
AATTCTACGCCMTaCATC-AGTGGCGTACCCGCC—GGGAAGGAGGGCAAGrrATCGA 
AAATCTATGTCAAGCTCATCGAGGAGTGCACCGACCTGCAGAAAGAGGGCGAGTTCTCCA 
* **** ** ****** * * *** *» *** ** *** **** ** * 

CCTGCTTCACGGAGCTCCAGCGGAACTTCCTGAAGCAGCGCCCMCCAAGCTGAAGAGTC 
CCTGCTTCACGGAGCTCCAGCGGAACTTCCTGAAGCAGCGCCCAACCAAGCTGAAGAGTC 
TCTGCmATGGGGCTTCAGAAGTAOTCCTGAACTGTCGCCCAACCAAGCTGAAGCGCC 
CCTGCTTCACAGMCrACAGAGAGACTTCCTGAAGCAGCGCCCCACCAAGCTCAAGAGCC 
****** * * ** *** ********** ***** ******** *** * * 

TCATCCGCG*GGTCAAGCACrGGTACCAACrGTGTAAGGAGAAGCTGGGGAAGCCATTGC 
TCATCCGCGTGGTCAAACACrGGTACCAACTGTGTAAGGAGAAGCTGGGGAAGCCACTGC 
TCATCCGCCTGGTCACGCACTGGTACCAACTGTGTAAGGAGAAGCTGGGGGACCCGCTGC 

TCATCCGCCTAGTCAAGCACTGGTACCAAAATTGTAAGAAGAAGCTTGGGAAGC TGC 

********** **** ************ ****** ******* *** * * *** 

CTCCACAGTACGCCCTAGAGTTGCrCACrGTCTTTGCCTGGGAACAAGGGAATGGATGTT 
CCCCACAGTATGCCCTGGAGCTACTCACTGTCrATGCCTGGGAACAGGGGAATGGATGTA 
CCCCACAGTATGCCCrGGAGCrGCrCACACTCGATGCCTGGGAGTATGGGAGTCGAGTAA 
CACCTCAGTATGCCCTGGAGCTCCTGACGGTCTATGCTTGGGAGCGAGGGAGCATGAAAA 

* ** ***** ***** *** * ** ** ** *** ***** **** 

ATGAGTTCAACACAGCCCAGGGCTTCCGGACCGTCTTGGAACTGGTCATCAATTATCAGC 
ATGAGTTCAACACAGCCCAGGGGTCCGGACCGTCTTGGAACTGGTCATCAATTATCAGC 
CTAMTTCAACACAGCCCAGGGCTTCTGAACCGTCTTGGAACTGGTCACCAAGTACAAAC 
CACATTTCMCACAGCCCMGGATTTCGGACGGTCTTGGAATTAGTCATAAACTACCAGC 
* ************** ** ** * ** ********* * **** ** ** * * 

ATCrTCGMTCrACrGGACAMGTATTATGACTTTCAACACCAGGAGGTCTCCAAATACC 
ATGTCGMTCTACTGGACAAAGTATTATGACnTCAACACAAGGAGGTaCCAAATACC 
AGCTTCAMTCTACrGGACAGTGTATTATGACTTTCGACATCAAGAGGTCTCTGAATACC 
MCrcrGCATQACTGGACAMGTATTATGACTTTAAAAACCCCATTATTGAAAAGTACC 

* ** ************ ************* * * * * **** 

TGCACAGACAGCTCAGAAAAGCCAGGCCTGTGATCCTGGACCCAGCTGACCCAACAGGGA 
TGCACAGACAGCTCAGAAAAGCCAGGCCTGTGATCCTGGACCCAGCTGACCCGACAGGGA 

TGCACCAACAGCTCAAAAAA- - 

TGAGAAGGCAGCTCACGAAACCCAGGCCTGTGATCCTGGACCCGGCGGACCCTACAGGAA 
** ******* *** 

ATGTGGCCGGTGGGAACCCAGAGGGCTGGAGGCGGTTGGCTGAAGAGGCTGATGTGTGGC 
ATGTGGCTGGTGGGAACCCAGAGGGCTGGAGGCGGTTGGCTGAAGAGGCTGATGTGTGGC 



ACTTGGGTGGTGGAGACCCAAAGGCTTGGAGGCAGCTGGCACAAGAGGCTGAGGCCTGGC 



TATGGTACCCATGTTTTATTAAAAAGGATGGTTCCCGAGTGAGCTCCTGGGATGTGCCGA 
TGTGGTACCCATGTTTTATGAAAAATGATGGTTCCCGAGTGAGCTCCTGGGATGTGCCGA 



TGMTTACCCATGGTTTAAGAATTGGGATGGGTCCCCAGTGAGCrCCTGGATTCTGCrGG 



CGGTGGTTCaGTACCTTTTGAGCAGGTAGAAGAGAACTGGACATGTATCCTGCTGTGAG 
CGGTGGTTCCTGTACCTTTTGAGCAGGTGGAGGAGAACTGGACATGTATCCTGCTGTGAG 



TGAGACCTCCTGCTTCCTCCCTGC CATTCATCCCTGCCCCTCTCCATGAA 



FIGURE 3B 
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L3_M33863_ 
L2_X58077_ 
L1_M55982_ 
hOASU<02874_ 



L3J63863_ 
U_X58077_ 
L1_M55982_ 
hOASl_X02874_ 



L3_M33863_ 
L2J(58077_ 
L1_M55982_ 
hOASl_X02874_ 



L3_M33863_ 
L2_X58077_ 
L1_M55982_ 
hOASl_X02874_ 



L3J63863_ 
L2JC58077. 
L1_M55982_ 
hOASlJ(02874, 



CACAGCAGCACCTGCCCAGGAGACTGCTGGTCAGGGGCATTTGCTGCTCTGCrGCAGGCC 
CACAGCAGCACCTGCCCAGGAGACTGCTGGTCAGGGGCATTTGCTGCTCTGCTGCAGGCC 



GCTTGAGACATATAGCTGGAGACCATTCTTTCCAAAGAACrTACCTCT-TGCCAAAGGCC 



CATGACCCAGTGAGGGAGGGCCCCACCrGGCATCAGACTCCGTGCTTCTGATGCCrGCCA 
CATGACCCAGTGAGGCAGGGCCCCACCTGGCATCAGACTCCGTGCTTCTGATGCCTGCCA 



ATTTA - -TATTCATATAGTGACAGGCTGTGCTCCATATTTTACAGTCATTTTGGTCACAA 



GCCATGTTTGACTCCTGTCCAATCACAGCCAGCCTTCCTCAACAGATTCAGAAGGAGAGG 
GCCATGTTTGACrCCTGTCCAATCACAGCCAGCCTTCCTCAACAGATTCAGAAGGAGAGG 



TCGAGGGTT- - - TCTGGMTTTTCACATCCCTTGTCCAGAATTCATTCC CCTAAGAGTAA 



AAAGAACACACGCTTGGTGT CCATCTGTC CACCTGTTGGAAGGTTCTGTCT G ACAAAGTC 
AAAGAACACACGCTTGGTGTCCATCTGTCCACCTGTTGGAAGGTTCT GT CTGAC AAAGTC 



TAATAAATAATCTCTAACACCAAAAA- 



TGATCAACAATAAAC CACAGCAG GTGC C - GTCA 
TGATCAACAATAAACCACAGCAGGTGCCCGTCA 



FIGURE 3C 
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Resultat CLUSTALW 



Sequence 1 : hOAS 1_X02874_ 364 aa 
Sequence 2 : L3_M33863_ 367 aa 

Sequence 3 : L2_X58077_ 367 aa 

Sequence 4 : L1_M55982_ 251 aa 

Alignement.... 

Sequences (3:4) alignees Score : 66 

Sequences (1:2) alignees Score : 67 

Sequences (2:3) alignees Score : 95 

Sequences (2:4) alignees Score : 66 

Sequences (1:3) alignees Score : 67 

Sequences (1:4) alignees Score : 58 

Alignement... 

Groupe 1 : sequences : 2 Score : 6013 

Groupe 2 : sequences : 3 Score : 5336 

Groupe 3 : sequences : 4 Score : 3306 

Score d 'alignement 8114 

L3_M33863_(SEQiDNO:24)MEHGlRSIPAWTlDKFI£DYLLP 
L2JC58077_(seoidno:26 )ME hguot 

^^^^9S2_(SEQiDNO:2S)MEQDLRSIPASKL0KFI£N-HL POTS FCADLREVI DAL CALLKDRSFRGPVRiWRASKGV 



13_M33863_ 
L2JC58077_ 
hOASUC02874_ 
L1_M5S982_ 



KGGSSGKGTTLKGRSDADLWFLNNLTSF£DQLNRKG£PIKHIlCKQLYEVQHERRFRVKr 
KGGSSGKGTTLKGRS0Ai3LVVFLNNLTSF£DQLNRRGEPIK£IKKQLYEVQH£RRFRVKf 
KG<^SGKGTTLRGRSDAOLVVFLSPLTTFQOQLNRRGEFIQ£IRRQLEACQR£RALSVKF 
KG—- KGTALKGRSOADLWFLNNLTSF£DQLNOQGVLIK£IKKQLCEVQH£RRCGVKF 



L3J433863_ EVQSSWVYPhWRSLSFKLSAPHLHQEVEFOVLPAFDVLGHWrSSKPDPRIYAILIEECTS 

L2JC5S077. £VQS5WWPNAR5LSrKLSAPHLHQ£VEFDVLPAFDVLGHGSINKXPNPLIYTTir/V£CrS 

hOASl_X02374_ EVQAPRWGNPRALSP/l^SLQLGEGVErOVLPAFDALGQLTGSYKPNPQrYVKLIEECTD 

IU455982_ EVHSLR5PNSRALSFKLSAP0LLKEVKF0VLPAYOLL0HLNILKJCPNQQFYANLISGVP- 



L3_M33863_ 
12J(58077_ 
HOA5UC02874. 
L1_M55982_ 



L3J433863. . 
L2J<58077_ 
hOASl_X02874_ 
L:LM55982_ 



LGKDG£FSTCFT£LQRNFLK(^PTKLJCSLIRLV1G<WYQLCKEKLGKPLPPQYALELLTVF 

LGKDGEFSTCFTELQRNFLKQRPTKLIGLIRL\^HffYQLCKEXLGKPLPPQYAL£LLTVY 

LQKEGEFSTCFTELQRDFLKQRPTKLK5LIRLVKhWQNCKi0<LGK-LPPQYAL£LLTVY 

AGKEGKLSICFMGLQKYFLNCRPTKLKRLIRLVTHWYQLCJCEKLGOPLPPQYALELLTLD 
*:*::*** **;**; mmmmm^mmm* *«.««« 

AWEQGNGCYEFhn*Al^rRTVLELVlNYQHLRIYWTKYYDFQHQEVSKYLHRQLRKARP^ 
AWEQGNGCNEF^AQG FRTVLE I VINYQHLRIYWTKYYDFQ 
AWERGSWCTHFhrTAQGF^ 

*** * mmmmmmm 



L3J63863, 
12JG3077_ 
hOASl_X02S74_ 
11X55982_ 



L0PADPTGNVAGGNPEGWRRLAEEAOVWLWYPCFIKKDG5RVSSWDVPTVVPVPFEQVEE 
LDPAOPTGNVAGGNPEGVVRRLAEEADVWLWYPCFMKNDGSRVSSWOVPTVVPVPFEQVEE 
LDPADPTGNLGGGDPKGWRQUQEAEAWLNYPCFKNWDbSPVSSWILLVRPPASSLPFIP 



13J*33863_ 
L2J(58077. 
hOASU<02874_ 
ll_M55982_ 



IWTCIU 
APIHEA- 



FIGURE 4 
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Souris 

Lignees consanguines de laboratoire : 



Souris sauvages : 



BALB/c, C57BL/6, DDK, 129, C3H et DBA/1 
-> sensibles a ['infection par le virus WN 



SEG/Pas {Mus spretus), MAI/Pas, MBT/Pas (Mus m. musculus) 
resistantes a F infection par le virus WN 

Generation de souris de premier croisement en retour (BC1) 



Parents 



o^MAI/Pas £C57BJ76 
X 

b*MBT/Pas ? BALB/c 



Fl 



£C57BL76 
° BALB/c 



BC1 



I I 

a) BC1 b) BC1 

(C57BL76 (C57BU6 
x x 

MAI) MBT) 



c) BC1 d) BCI 

(BALB/c (BALB/c 
x x 

MAI) MBT) 



Virus 

Injection du virus West Nile (WN) 
Souris agees de 5 semaines 

Observation des souris pendant les 14 jours suivant Tinfection 
Genotypage des alleles Flv 

marqueurs flanquant le locus Flv sur le chromosome 5 de la souris 



FIGURE 8 
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Parents de la generation de premier croisement en retour (BC1) 



M'o.3 No.107 No.27 No.154 iN'o.222 No.244 No.146 iVo_31 
Chr5desouris a* a* a* 2 <** 




D5MU321 
D5MU247 



Pheaorype; R 



R 



R 



R 



R R 



FIGURE 10 



2823224 

12/18 




* 



2823224 



13/18 



CD 

Pu 

00 



CO 



00 

oo 
i 

CO 
CO 
PU 



a 
< 

DQ 

C 
o 

a 



o 

CO 

o 

CM 



CD 

i—i 
• o 



*-< OS 

_< CO 

o o 

~ eg 



2 2 



00 

oo ^ 

CO 



CO 
LO 



CO 



<o 
o 

00 
CO 
LO 



o 
o 



. OS 
CM 

co 



CD 
LO 



oa 



CO 
CM 



00 
VO 

CO . 

in 

+ 

CO 

o 
in 

Ch 
IS 

» s 

o ~ 

IS r-H 

— o 

< in 

CO ^ 



LO 
C- 

00 

o 

< 
c 

i 

o 
< 



1) 
c 

a 
OS 



00 

CO (v 

00 o 

co oo 

CO LO 

2 x 

co eg 

J -J 

t— t r-H 

00 00 

< < 

9 9 

LO LO 

OJ CO 



CvJ 
00 

a> 

LO 
LO 



LO 
CO 
CO 



* — - r\T ^ 
r-H °* CO ^ 



00 

< 

9 

PS oo 

LO CO 



< ~ 

CO 

o 

CO CO 
CO CO 



p 
g 

s 

00 
CM 



<u 
cr 
aJ 

6 

o 



00 oo 
cr> o 

CO oo 



(X 

>J 

CO 
CO 

00 
<D 

s 

oo 
CO 
00 

.»— I 

s 

LO 

Q 



CO 

ct, 

00 
00 
t-H 

s 

cn 
oo 



o h eg co 




2823224 



w 

H 
fa 




* 



2823224 



16/15 



4 UEF/cell. 



■■. ■ ^ ^ ' * • 

■:\ .... " ^ • 




Confcrole 



INF-a (20 Ul/ml) 



0,1 UFF/cell. 




Controle 



FIGURE 16 



INF-a (10 Ul/ml) 



2823224 

17/18 

> Exon 1 

AGGCTTCGATGGGOAGGTACCTGTTCAGAAGCCCTAACGCCATrGGCTGCTCGGGCCTG 
GATGATTTGCATATCCGCGCCCTTCCCGGGAAATGGAAACTGAAAGTCCCATTTCTGCTT 
CAGCCAGCCTAGGAGACACAGGACCT GCTGGCTGTArl'r^TAAA AGcr nr.A rr~TA og A 

TGGAGCAGCATCTGAGGAGCATCCCGGCCTCGAAGCTTGATAAGTTCATAGAGAAC 

CATCTCCCGGACACCAGCTTCTGTGCTGACCTCAGAGAAGTCATAGATGCCCTGTG 

TGCTCTCCTGAAGGACAGATCCTTCCGGGGCCCCGTCCGCCGAATGAGGGCCTCT 
. , w (SEQIDNO:IO\ 

A^GGGCTCAAGGTGAGCCTrCCTCAGCCTGAGCTGG CCGAGATrrAr^TnGGArArrf? 
AmTCAGAAGCCACJGCTGCAACCCrGATCCCTCCTCnAATTCTGATCACAGCTGGCGA 

GTTCCCCACTGrrAGGrrATQTCGATTTCAGAGTCGGGGAAACTGAGGCCCAGAATGGC 
> Exon 2 

F2 (SEQrDNO:l2) 

TCAGGGCTGACIAATATrCTCCTGCACATCX^GCAGCT TGCrrCATCrATrrAArrATrrA 
TCCATCCATCCATCCATCIATCACCTrGGTGATGGACTCCAGTTCAGCATCTGGACCTCCC 
AGCATGGCTCrCCCTGTCCTrrGTCATTCTCTITCTrGTCTrrCAGGGCAAAGGCACCGC 
GCTCAAGGGCAGGTCAGACGCTGACCTGGTGGTGTTCCTTAACAATCTCACCAGCT 

TTGAGGATCAGTTAAACCAACAGGGAGTGTTGATTAAGGAAATTAAGAAACAGCTG 

R3 (SEQIDNOI3) 

TGCGAGGTTCAGCATGAGAGACGTTGTGGAOTC. A ^TTTr. Ar.crrr a r a r.rrr, , 

GGAGTCCCAACTCCCGGGCTCTGAGCTTCAAGCTGAGCGCCCCCGACCTGCTGAA 

GGAGGTGAAGTTTGATGTGCrGCCAGCCTATGATTTACTGG^CnAAGGCAGCCTGCCA 

GAGAGCCTCAGCTCACCOTCTGCATGCCITCATCCTCCCTrCTAGTTCCAC 
TGTGGACATGTGTGTTOCGTAGOTG^^ 

> Exon 3 

TG^GAG<^GgACmGX\GTGCACAGCATGTGTGCAGTeCTAAGGAGTGGTGGGGCAG 
ATGGGXATATGCGGA^GATGrcrGCrGGGGAAAAACGCTGCCTGTTCGCTGAACCCCA 

TAGGCTGTGATTCTGGA cctgggga gactgaggaacctca gagaggggctgagctgttc 

CACTGAATGA^TCT^ 

attctacgccaatctcatcagtgcgcgtaccccgccggggaaggagggcaagttat 

CGATCTGCTTTATGGGGCTTCAGAAGTACTTCCTG AACTGTCG^^ i r.r-r^ 

mgcgcctcatccgcctggtcacgcactggtaccaactggtaaggcattggcctggt 

CACTGTGCGCITCATCTGTACAGAGTGXAGAGA.CGGGGCAGAGAAAATGTGTACTCX\GT 

TCGGCGTCTATTGAGGTAA!IAA<^CTATCACATGACCAAAACGCTCCTGGGAAGGAAGGA 
■ ■ (SEQIDN0:I7) R5 

TATTCnATGTTIACA CATCTA A GOTa r a crm^^r. A rzr-.n. A ^ GTCA g „ nn 1 |1T11 CT 
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il/ii 

> Exon 4 (terminal) 

GCTCTC A CTCATGCTGTCCTG ATTCCTCCTGGCCCTGTT A CTTA CGTGCTCA GTCTGTGG 
F5 (SEQIDNO:!9) 

AGCACACAcrrnTrrATrrrAArr^rTrAr^rTTnnrTATAr^Ar a AGGCATAGACT 

GAATTCAAGTGACTGGGTGTG A CAGTGTGA CAATAACCCTGTCATG ACATCATCA GGTG 

GCAGCTGAATTGAGCCTGTGAGAAGCAGCCCC^CACACAACCACCAGGAACCCCGTITT 

. F6 (SEQIDNO:22) T 
TTTCTCATTGCCTTTCTCTTCTCAGTOTA a GGAG a a nrrnr. r,r,r. a rrrr.r^r.rrr-nn * 

CAGTATGCCCTGGAGCTGCTCACAGTCTATGCCTGGGAGTATGGGAGTCGAGTAAC 

(SEQfDNO:20) P7 
TAAATTC AAC AC A GCCCAGG GCTTCTG AiA C CGTCTTGG.AA CTGGTCA CCA A GTA CA A A 

„ (SEQ!DNO:2l) 

CAGCTTCAAATCTACTGGACAGTC7IATTATGACTTTCGACATCAAGAGGTCT 
R8 

TGCACCAArAGTTL-AAAAAA 
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LISTE DE SEQUENCES 

<110> INSTITUT PASTEUR 

<120> Molecules d'ADN contehant les genes OAS , leurs 

applications et utilisations des produits desdits genes 

<130> 226CAS92FR 

<140> 
<1 41 > 

<160> 32 

<170> Patentln Ver. 2.1 

<210> 1 

<211> 1 1029 

<212> ADN 

<213> Flavivirus sp. 
<220> 

<221> CDS ' 

<222> (97) (10395) 

<400> 1 

agtagttcgc ctgtgtgagc tgacaaactt agtagtgttt gtgaggatta acaacaatta 60 

acacagtgcg agctgtttct tagcacgaag atctcg atg tct aag aaa cca gga 114 

Met Ser Lys Lys Pro Gly 
1 • 5 

ggg ccc ggc aag age egg get gtc aat atg eta aaa cgc gga atg ccc 162 

Gly Pro Gly Lys Ser Arg Ala Val Asn Met Leu Lys Arg Gly Met Pro 
10 15 20 

cgc gtg ttg tec ttg att gga ctg aag agg get atg ttg age ctg ate 210 
Arg Val Leu Ser Leu lie Gly Leu Lys Arg Ala Met Leu Ser Leu lie 
25 30 35 

gac ggc aag ggg cca ata cga ttt gtg ttg get etc ttg gcg ttc ttc 258 
Asp Gly Lys Gly Pro lie Arg Phe Val Leu Ala Leu Leu Ala Phe Phe 
40 45 50 

agg ttc aca gca att get ccg acc cga gca gtg ctg gat cga tgg aga 306 
Arg Phe Thr Ala lie Ala Pro Thr Arg Ala Val Leu Asp Arg Trp Arg 
55 60 65 70 

ggt gtg aat aaa caa aca gcg atg aaa cac ctt ctg agt'ttt aag aag 354 
Gly Val Asn Lys Gin Thr Ala Met Lys His Leu Leu Ser Phe Lys Lys 
75 80 85 

gaa eta ggg acc ttg acc agt get ate aat egg egg age tea aaa caa 402 
Glu Leu Gly Thr Leu Thr Ser Ala He Asn Arg Arg Ser Ser Lys Gin 
90 95 1 00 

aag aaa aga gga gga aag acc gga att gca gtc atg att ggc ctg ate 450 
Lys Lys Arg Gly Gly Lys Thr Gly He Ala Val Met He Gly Leu He 
105 110 115 

gee age gta gga gca gtt acc etc tct aac ttc caa ggg aag gtg atg 498 
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Ala Ser Val Gly Ala Val Thr Leu Ser Asn Phe Gin Gly Lys Val Met 
120 125 130 

atg acg gta aat get act gac gtc aca gat gtc ate acg att cca aca. 546 
Met Thr Val Asn Ala Thr Asp Val Thr Asp Val lie Thr lie Pro Thr 
135 140 145 150 

get get gga aag aac eta tgc att gtc aga gca atg gat gtg gga tac 594 
Ala Ala Gly Lys Asn Leu Cys lie Val Arg Ala Met Asp Val Gly Tyr 
155 160 165 

atg tgc gat gat act ate act tat gaa tgc cca gtg ctg teg get ggt 642 
Met Cys Asp Asp Thr lie Thr Tyr Glu Cys Pro Val Leu Ser Ala Gly 
170 175 180 

aat gat cca gaa gac ate gac tgt tgg tgc aca aag tea gca gtc tac 690 
Asn Asp Pro Glu Asp lie Asp Cys Trp Cys Thr Lys Ser Ala Val Tyr 
185 190 195 

gtc agg tat gga aga tgc acc aag aca cgc cac tea aga cgc agt egg 738 
Val Arg Tyr Gly Arg Cys Thr Lys Thr Arg His Ser Arg Arg Ser Arg 
200 205 210 

agg tea ctg aca gtg cag aca cac gga gaa age act eta gcg aac aag 786 
Arg Ser Leu Thr Val Gin Thr His Gly Glu Ser Thr Leu Ala Asn Lys 
215 220 225 230 

aag ggg get tgg atg gac age acc aag gee aca agg tat ttg gta aaa 834 
Lys Gly Ala Trp Met Asp Ser Thr Lys Ala Thr Arg Tyr Leu Val Lys 
235 240 245 

aca gaa tea tgg ate ttg agg aac cct gga tat gee ctg gtg gca gee 882 
Thr Glu Ser Trp lie Leu Arg Asn Pro Gly Tyr Ala Leu Val Ala Ala 
250 255 260 

gtc att ggt tgg atg ctt ggg age aac acc atg cag aga gtt gtg ttt 930 
Val He Gly Trp Met Leu Gly Ser Asn Thr Met Gin Arg Val Val Phe 
265 270 275 

gtc gtg eta ttg ctt ttg gtg gec cca get tac age ttt aac tgc ctt 978 
Val Val Leu Leu Leu Leu Val Ala Pro Ala Tyr Ser Phe Asn Cys Leu 
2.80 285 290 

gga atg age aac aga gac ttc ttg gaa gga gtg tct gga gca aca tgg 1026 
Gly Met Ser Asn. Arg Asp Phe Leu Glu Gly Val Ser Gly Ala Thr Trp 
295 300 305 310 

gtg gat ttg gtt etc gaa ggc gac age tgc gtg act ate atg tct aag 1074 
Val Asp Leu Val Leu Glu Gly Asp Ser Cys Val Thr He Met Ser Lys 
315 320 325 

gac aag cct acc ate gat gtg aag atg atg aat atg gag gcg gee aac 1122 
Asp Lys Pro Thr He Asp Val Lys Met Met Asn Met Glu Ala Ala Asn 
330 335 340 

ctg gca gag gtc cgc agt tat tgc tat ttg get acc gtc age gat etc 1170 
Leu Ala Glu Val Arg Ser Tyr Cys Tyr Leu Ala Thr Val Ser Asp Leu 
345 350 355 

tec acc aaa get gcg tgc ccg acc atg gga gaa get cac aat gac aaa 1218 
Ser Thr Lys Ala Ala Cys Pro Thr Met Gly Glu Ala His Asn Asp Lys 
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360 365 370 



cgt get gac cca get ttt gtg tgc aga caa gga gtg gtg gac agg ggc 1266 
Arg Ala Asp Pro Ala Phe Val Cys Arg Gin Gly Val Val Asp Arg Gly 
375 380 385 390 

tgg ggc aac ggc tgc gga eta ttt ggc aaa gga age att gac aca tgc 1314 
Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Ser lie Asp Thr Cys 
395 400 405 

gec aaa ttt gec tgc tct acc aag gca ata gga aga acc ate ttg aaa 1362 
Ala Lys Phe Ala Cys Ser Thr Lys Ala lie Gly Arg Thr lie Leu Lys 
410 415 420 

gag aat ate aag tac gaa gtg gec att ttt gtc cat gga cca act act 1410 
Glu Asn He Lys Tyr Glu Val Ala He Phe Val His Gly Pro Thr Thr 
425 430 435 

gtg gag teg cac gga aac tac tec aca cag gtt gga gee act cag gca 1458 
Val Glu Ser His Gly Asn Tyr Ser Thr Gin Val Gly Ala Thr Gin Ala 
440 445 450 

ggg aga ttc age ate act cct gcg gcg cct tea tac aca eta aag ctt 1506 
Gly Arg Phe Ser He Thr Pro Ala Ala Pro Ser Tyr Thr Leu Lys Leu 
455 460 465 470 

gga gaa tat gga gag gtg aca gtg gac tgt gaa cca egg tea ggg att 1554 
Gly Glu Tyr Gly Glu Val Thr Val Asp Cys Glu Pro Arg Ser Gly He 
475 480 485 

gac acc aat gca tac tac gtg atg act gtt gga aca aag acg ttc ttg 1602 
Asp Thr Asn Ala Tyr Tyr Val Met Thr Val Gly Thr Lys Thr Phe Leu 
490 495 500 

gtc cat cgt gag tgg ttc atg gac etc aac etc cct tgg age agt get 1650 
Val His Arg Glu Trp Phe Met Asp Leu Asn Leu Pro Trp Ser Ser Ala 
505 510 515 

gga agt act gtg tgg agg aac aga gag acg tta atg gag ttt gag gaa 1698 
Gly Ser Thr Val Trp Arg Asn Arg, Glu Thr Leu Met Glu Phe Glu Glu 
520 525 530 

cca cac gec acg aag cag tct gtg ata gca ttg ggc tea caa gag gga 1746 
Pro His Ala Thr Lys Gin Ser Val He Ala Leu Gly Ser Gin Glu Gly 
535 540 545 550 

get ctg cat caa get ttg get gga gee att cct gtg gaa ttt tea age 1794 
Ala Leu His Gin Ala Leu Ala Gly Ala He Pro Val Glu Phe Ser Ser 
555 560 565 

aac act gtc aag ttg acg teg ggt cat ttg aag tgt aga gtg aag atg 184 2 
Asn Thr Val Lys Leu Thr Ser Gly His Leu Lys Cys Arg Val Lys Met 
570 575 * 580 

gaa aaa ttg cag ttg aag gga aca acc tat ggc gtc tgt tea aag get 1890 
Glu Lys Leu Gin Leu Lys Gly Thr Thr Tyr Gly Val Cys Ser Lys Ala 
585 590 595 

ttc aag ttt ctt ggg act ccc gca gac aca ggt cac ggc act gtg gtg 1938 
Phe Lys Phe Leu Gly Thr Pro Ala Asp Thr Gly His Gly Thr Val Val 
600 605 610 
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ttg gaa ttg cag tac act ggc acg gat gga cct tgc aaa gtt cct ate 1986 
Leu Glu Leu Gin Tyr Thr Gly Thr Asp Gly Pro Cys Lys Val Pro lie 
615 620 625 630 

teg tea gtg get tea ttg aac gac eta acg cca gtg ggc aga ttg gtc 2034 
Ser Ser Val Ala Ser Leu Asn Asp Leu Thr Pro Val Gly Arg Leu Val 
635 640 645 

act gtc aac cct ttt gtt tea gtg gee acg gee aac get aag gtc ctg 2082 
Thr Val Asn Pro Phe Val Ser Val Ala Thr Ala Asn Ala Lys Val Leu 
650 655 660 

att gaa ttg gaa cca ccc ttt gga gac tea tac ata gtg gtg ggc aga 2130 
lie Glu Leu Glu Pro Pro Phe Gly Asp Ser Tyr lie Val Val Gly Arg 
665 670 675 

gga gaa caa cag att aat cac cat tgg cac aag tct gga age age att 2178 
Gly Glu Gin Gin He Asn His His Trp His Lys Ser Gly Ser Ser He 
680 685 690 

ggc aaa gee ttt aca acc acc etc aaa gga gcgcag aga eta gee get 2226 
Gly Lys' Ala Phe Thr Thr Thr Leu Lys Gly Ala Gin Arg Leu Ala Ala 
695 700 705 710 

eta gga gac aca get tgg gac ttt gga tea gtt gga ggg gtg ttc acc 2274 
Leu Gly Asp Thr Ala Trp Asp Phe Gly Ser Val Gly Gly Val Phe Thr 
715 720 725 

tea gtt ggg aag get gtc cat caa gtg ttc gga gga gca ttc cgc tea 2322 
Ser Val Gly Lys Ala Val His Gin Val Phe Gly Gly Ala Phe Arg Ser 
730 735 740 

ctg ttc gga ggc atg tec tgg ata acg caa gga ttg ctg ggg get etc 2370 
Leu Phe Gly Gly Met Ser Trp He Thr Gin Gly Leu Leu Gly Ala Leu 
745 750 755 

ctg ttg tgg atg ggc ate aat get cgt gat agg tec ata get etc acg 2418 
Leu Leu Trp Met Gly He Asn Ala Arg Asp Arg Ser He Ala Leu Thr 
760 765 770 

ttt etc gca gtt gga gga gtt ctg etc ttc etc tec gtg aac gtg cac 2466 
Phe Leu Ala Val Gly Gly Val Leu Leu Phe Leu Ser Val Asn Val His 
775 780 785 790 

get gac act ggg tgt gee ata gac ate age egg caa gag ctg aga tgt 2514 
Ala Asp Thr Gly Cys Ala He Asp He Ser Arg Gin Glu Leu Arg Cys 
795 800 805 

gga aat gga gtg ttc ata cac aat gat gtg gag get tgg atg gac egg 2562 
Gly Asn Gly Val Phe He His Asn Asp Val Glu Ala Trp Met Asp Arg 
810 815 ' 820 

tac aag tat tac cct gaa acg cca caa ggc eta gee aag ate att cag 2610 
Tyr Lys Tyr Tyr Pro Glu Thr Pro Gin Gly Leu Ala Lys He He Gin 
825 830 835 

aaa get cat aag gaa gga gtg tgc ggt eta cga tea gtt tec aga ctg 2658 
Lys Ala His Lys Glu Gly Val Cys Gly Leu Arg Ser Val Ser Arg Leu 
840 845 850 
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gag cat caa atg tgg gaa gca gtg aag gac gag ctg aac act ctt ttg 2706 
Glu His Gin Met Trp Glu Ala Val Lys Asp Glu Leu Asn Thr Leu Leu 
855 860 865 870 

aag gag aat ggt gtg gac' ctt agt gtc gtg gtt gag aaa cag gag gga 2754 
Lys Glu Asn Gly Val Asp Leu Ser Val Val Val Glu Lys Gin Glu Gly 
875 880 885 

atg tac aag tea gca cct aaa cgc etc acc gec acc acg gaa aaa ttg 2802 
Met Tyr Lys Ser Ala Pro Lys Arg Leu Thr Ala Thr Thr Glu Lys Leu 
890 895 900 

gaa att ggc tgg aag gec tgg gga aag agt att tta ttt gca cca gaa 2850 
Glu lie Gly Trp Lys Ala Trp Gly Lys Ser lie Leu Phe Ala Pro Glu 
905 910 915 

etc gec aac aac acc ttt gtg gtt gat ggt ccg gag acc aag gaa tgt 2898 
Leu Ala Asn Asn Thr Phe Val Val Asp Gly Pro Glu Thr Lys Glu Cys 
920 925 930 

ccg act cag aat cgc get tgg aat age tta gaa gtg gag gat ttt gga 2946 
Pro Thr Gin Asn Arg Ala Trp Asn Ser Leu Glu Val Glu Asp Phe Gly 
935 940 945 950 

ttt ggt etc acc age act egg atg ttc ctg aag gtc aga gag age aac 2994 
Phe Gly Leu Thr Ser Thr Arg Met Phe Leu Lys Val Arg Glu Ser Asn 
955 960 965 

aca act gaa tgt gac teg aag ate att gga acg get gtc aag aac aac 304 2 
Thr Thr Glu Cys Asp Ser Lys lie lie Gly Thr Ala Val Lys Asn Asn 
970 975 980 

ttg gcg ate cac agt gac ctg tec tat tgg att gaa age agg etc aat 3090 
Leu Ala lie His Ser Asp Leu Ser Tyr Trp lie Glu Ser Arg Leu Asn 
985 990 995 

gat acg tgg aag ctt gaa agg gca gtt ctg ggt gaa gtc aaa tea tgt ' 3138 
Asp Thr Trp Lys Leu Glu Arg Ala Val Leu Gly Glu Val Lys Ser Cys^ 
1000 1005 1010 

acg tgg cct gag acg cat acc ttg tgg ggc gat gga ate ctt gag agt 3186 
Thr Trp Pro Glu Thr His Thr Leu Trp Gly Asp Gly lie Leu Glu Ser 
1015 1020 1025 ~ 1030 

gac ttg ata ata cca gtc aca ctg gcg gga cca cga age aat cac aat 3 234 
Asp Leu lie lie Pro Val Thr Leu Ala Gly Pro Arg Ser Asn His Asn 
1035 1040 1045 

egg aga cct ggg tac aag aca caa aac cag ggc cca tgg gac gaa ggc 3 282 
Arg Arg Pro Gly Tyr Lys Thr Gin Asn Gin Gly Pro Trp Asp Glu Gly 
1050 1055 1060 

egg gta gag att gac ttc gat tac tgc cca gga act acg gtc acc ctg 3330 
Arg Val Glu lie Asp Phe Asp Tyr Cys Pro Gly Thr Thr Val Thr Leu 
1065 1070 " 1075. 

agt gag age tgc gga cac cgt gga cct gec act cgc acc acc aca gag 3378 
Ser Glu Ser Cys Gly His Arg Gly Pro Ala Thr Arg Thr Thr Thr Glu 
1080 1085 1090 

age gga aag ttg ata aca gat tgg tgc tgc agg age tgc acc tta cca 34 26 
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Ser Gly Lys Leu lie Thr Asp Trp Cys Cys Arg Ser Cys Thr Leu Pro 
1095 1100 1105 1110 

cca ctg cgc tac caa act gac age ggc tgt tgg tat ggt atg gag ate 3474 
Pro Leu Arg Tyr Gin Thr Asp Ser Gly Cys Trp Tyr Gly Met Glu lie 
1115 1120 1125 

aga cca cag aga cat gat gaa aag acc etc gtg cag tea caa gtg aat 3 522 
Arg Pro Gin Arg His Asp Glu Lys Thr Leu Val Gin Ser Gin Val Asn 
1130 1135 1140 

get tat aat get gat atg att gac cct ttt cag ttg ggc ctt ctg gtc 3570 
Ala Tyr Asn Ala Asp Met lie Asp Pro Phe Gin Leu Gly Leu Leu Val 
1145 1150 • 1155 

gtg ttc ttg gec acc cag gag gtc ctt cgc aag agg tgg aca gee aag 3618 
Val Phe Leu Ala Thr Gin Glu Val Leu Arg Lys Arg Trp Thr Ala Lys 
1160 1165 1170 

ate age atg cca get ata ctg att get ctg eta gtc ctg gtg ttt ggg 3666 
lie Ser Met Pro Ala lie Leu lie Ala Leu Leu Val Leu Val Phe Gly 
1175 1180 1185 1190 

ggc att act tac act gat gtg tta cgc tat gtc ate ttg gtg ggg gca 3714 
Gly lie Thr Tyr Thr Asp Val Leu Arg Tyr Val lie Leu Val Gly Ala 
1195 1200 1205 

get ttc gca gaa tct aat teg gga gga gac gtg gta cac ttg gcg etc 3762 
Ala Phe Ala Glu Ser Asn Ser Gly Gly Asp Val Val His Leu Ala Leu 
1210 1215 1220 

atg gcg acc ttc aag ata caa cca gtg ttt atg gtg gca teg ttt etc 3810 
Met Ala Thr Phe Lys He Gin Pro Val Phe Met Val Ala Ser Phe Leu 
1225 1230 1235 

aaa gcg aga tgg acc aac cag gag aac att ttg ttg atg ttg gcg get 3858 
Lys Ala Arg Trp Thr Asn Gin Glu Asn He Leu Leu Met Leu Ala Ala 
1240 1245 1250 

gtt ttc ttt caa atg get tat cac gat gee cgc caa att ctg etc tgg 3906 
Val Phe Phe Gin Met Ala Tyr His Asp Ala Arg Gin He Leu Leu Trp 
1255 1260 1265 1270 

gag ate cct gat gtg ttg aat tea ctg gcg gta get tgg atg ata ctg 3954 
Glu He Pro Asp Val Leu Asn Ser Leu Ala Val Ala Trp Met He Leu 
1275 1280 1285 

aga gec ata aca ttc aca acg aca tea aat gtg gtc gtc ccg ctg eta 4002 
Arg Ala He Thr Phe Thr Thr Thr Ser Asn Val Val Val Pro Leu Leu 
1290 1295 1300 

gec ctg eta aca ccc egg ctg aga tgc ttg aat ctg gat gtg tac agg 4050 
Ala Leu Leu Thr Pro Arg Leu Arg Cys Leu Asn Leu Asp Val Tyr Arg 
1305 1310 1315 

ata ctg ctg ttg atg gtc gga ata ggc' age ttg ate agg gag aag agg 4 098 
lie Leu Leu Leu Met Val Gly He Gly Ser Leu He Arg Glu Lys Arg 
13 20 13 25 1330 

agt gca get gca aaa aag aaa gga gca agt ctg eta tgc ttg get eta 4146 
Ser Ala Ala Ala Lys Lys Lys Gly Ala Ser Leu Leu Cys Leu Ala Leu 
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1335 1340 1345 1350 

gcc tea aca gga ctt ttc aac ccc atg ate ctt get get gga ctg att 4194 
Ala Ser Thr Gly Leu Phe Asn Pro Met lie Leu Ala Ala Gly Leu lie 
1355 1360 1365 

. gca tgt gat ccc aac cgt aaa cgc gga tgg ccc gca act gaa gtg atg 4242 
Ala Cys Asp Pro Asn Arg Lys Arg Gly Trp Pro Ala Thr Glu Val Met 
1370 1375 1380 

aca get gtc ggc eta atg ttt gcc ate gtc gga ggg ctg gca gag ctt 4290 
Thr Ala Val Gly Leu Met Phe Ala lie Val Gly Gly Leu Ala Glu Leu 
1385 1390 1395 

gac att gac tec atg gcc att cca atg act ate gcg ggg etc atg ttt 4338 
Asp lie Asp Ser Met Ala lie Pro Met Thr lie Ala Gly Leu Met Phe 
1400 1405 1410 

get get ttc gtg att tct ggg aaa tea aca gat atg tgg att gag aga 4386 
Ala Ala Phe Val lie Ser Gly Lys Ser Thr Asp Met Trp lie Glu Arg 
1415 1420 • 1425 1430 

acg gcg gac att tec tgg gaa agt gat gca gaa att aca ggc teg age 4434 
Thr Ala Asp lie Ser Trp Glu Ser Asp Ala Glu lie Thr Gly Ser Ser 
1435 1440 1445 

gaa aga gtt gat gtt egg ctt gat gat ggt gaa aac ttc cag etc atg 4482 
Glu Arg Val Asp Val Arg Leu Asp Asp Gly Glu Asn Phe Gin Leu Met 
1450 1455 1460 

aat gat cca gga gca cct tgg aag ata tgg atg etc aga atg gtc tgt 4530 
Asn Asp Pro Gly Ala Pro Trp Lys lie Trp Met Leu Arg Met Val Cys 
1465 1470 1475 

etc gcg att agt gcg tac ace ccc tgg gca ate ttg ccc tea gta gtt 4578 
Leu Ala lie Ser Ala Tyr Thr Pro Trp Ala lie Leu Pro Ser Val Val 
1480 1485 1490 

gga ttt tgg ata act etc caa tac aca aag aga gga ggt gtg ttg tgg 4626 
Gly Phe Trp lie Thr Leu Gin Tyr Thr Lys Arg Gly Gly Val Leu Trp 
1495 1500 1505 1510 

gac act ccc tea cca aag gag tac aaa aag ggg gac acg acc ace ggc 4674 
Asp Thr Pro Ser Pro Lys Glu Tyr Lys Lys Gly Asp Thr Thr Thr Gly 
1515 1520 . 1525 

gtc tac agg ate atg act cgt ggg ctg etc ggc agt tat caa gca gga 4722 
Val Tyr Arg lie Met Thr Arg Gly Leu Leu Gly Ser Tyr Gin Ala Gly 
1530 1535 1540 

gcg ggc gtg atg gtt gaa ggt gtt ttc cac acc ctt tgg cat aca aca 4770 
Ala Gly Val Met Val Glu Gly Val Phe His Thr Leu Trp His Thr Thr 
1545 1550 1555 

aaa gga gcc get ttg atg age gga gag ggc cgc ctg gac cca tac tgg 4818 
Lys Gly Ala Ala Leu Met Ser Gly Glu Gly Arg Leu Asp Pro Tyr Trp 
1560 1565 1570 

ggc agt gtc aag gag gat cga ctt tgt tac gga gga ccc tgg aaa ttg 4866 
Gly Ser Val Lys Glu Asp Arg Leu Cys Tyr Gly Gly Pro Trp Lys Leu 
1575 1580 1585 1590 



m 
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cag cac aag tgg aac ggg cag gat gag gtg cag atg att gtg gtg gaa 4914 
Gin His Lys Trp Asn Gly Gin Asp Glu Val Gin Met lie Val Val Glu 
1595 1600 1605 

cct ggc aag aac gtt aag aac gtc cag acg aaa cca ggg gtg ttc aaa 4962 
Pro Gly Lys Asn Val Lys Asn Val Gin Thr Lys Pro Gly Val ?he Lys 
1610 1615 * 1620 

aca cct gaa gga gaa ate ggg gec gtg act ttg gac ttc ccc act gga 5010 
Thr Pro Glu Gly Glu lie Gly Ala Val Thr Leu Asp Phe Pro Thr Gly 
1625 1630 1635 

aca tea ggc tea cca ata gtg gac aaa aac ggt gat gtg att ggg ctt 5058 
Thr Ser Gly Ser Pro lie Val Asp Lys Asn Gly Asp Val lie Gly Leu 
1640 1645 1650 

tat ggc aat gga gtc ata atg ccc aac ggc tea tac ata age gcg ata 5106 
Tyr Gly Asn Gly Val lie Met Pro Asn Gly Ser Tyr lie Ser Ala lie 
1655 1660 1665 1670 

gtg cag ggt gaa agg atg gat gag cca ate cca gec gga ttc gaa cct 5154 
Val Gin Gly Glu Arg Met Asp Glu Pro lie Pro Ala Gly Phe Glu Pro 
1675 1680 1685 

gag atg ctg agg aaa aaa cag ate act gta ctg gat etc cat ccc ggc 5202 
Glu Met Leu Arg Lys Lys Gin lie Thr Val Leu Asp Leu His Pro Gly 
1690 1695 1700 

gee ggt aaa aca agg agg att ctg cca cag ate ate aaa gag gee ata 5250 
Ala Gly Lys Thr Arg Arg lie Leu Pro Gin lie lie Lys Glu Ala lie 
1705 1710 1715 

aac aga aga ctg aga aca gee gtg eta gca cca ace agg gtt gtg get 5298 
Asn Arg Arg Leu Arg Thr Ala Val Leu Ala Pro Thr Arg Val Val Ala 
1720 1725 1730 

get gag atg get gaa gca ctg aga gga ctg ccc ate egg tac cag aca 5346 
Ala Glu Met Ala Glu Ala Leu Arg Gly Leu Pro lie Arg Tyr Gin Thr 
1735 1740 1745 1750 

tec gca gtg ccc aga gaa cat aat gga aat gag att gtt gat gtc atg 5394 
Ser Ala Val Pro Arg Glu His Asn Gly Asn Glu lie Val Asp Val Met 
1755 1760 1765 

tgt cat get ace etc ace cac agg ctg atg tct cct cac agg gtg ccg 5442 
Cys His Ala Thr Leu Thr His Arg Leu Met Ser Pro His Arg Val Pro 
1770 ■ 1775 1780 

aac tac aac ctg ttc gtg atg gat gag get cat ttc ace gac cca get 5490 
Asn Tyr Asn Leu Phe Val Met Asp Glu Ala His Phe Thr Asp Pro Ala 
1785 1790 1795 

agt ate gca gca aga ggt tac att tec aca aag gtc gag eta ggg gag 5538 
Ser lie Ala Ala Arg Gly Tyr lie Sef Thr Lys Val Glu Leu Gly Glu 
1800 1805 1810 

gcg gcg gca ata ttc atg aca gec ace cca cca ggc act tea gat cca 5586 
Ala Ala Ala lie Phe Met Thr Ala Thr Pro Pro Gly Thr Ser Asp Pro 
1815 1820 1825 1830 



2823224 



ttc cca gag tec aat tea cca att tec gac tta cag act gag ate ccg 
Phe Pro Glu Ser Asn Ser Pro He Ser Asp Leu Gin Thr Glu He Pro 
1835 1840 1845 



5634 



gat cga get tgg aac tct gga tac gaa tag ate aca gaa tac ace ggg 
Asp Arg Ala Trp Asn Ser Gly Tyr Glu Trp He Thr Glu Tyr Thr Gly 
1850 1855 1860 



5682 



aag acg gtt tgg ttt gtg cct agt gtc aag atg ggg aat gag att gee 
Lys Thr Val Trp Phe Val Pro Ser Val Lys Met Gly Asn Glu He Ala 
1865 1870 1875 



5730 



ctt tgc eta caa cgt get gga aag aaa gta gtc caa ttg aac aga aag 
Leu Cys Leu Gin Arg Ala Gly Lys Lys Val Val Gin Leu Asn Arg Lys 
1880 1885 1890 



5778 



teg tac gag acg gag tac cca aaa tgt aag aac gat gat tgg gac ttt 
Ser Tyr Glu Thr Glu Tyr Pro Lys Cys Lys Asn Asp Asp Trp Asp Phe 
1895 1900 1905 1910 



5826 



gtt ate aca aca gac ata tct gaa atg ggg get aac ttc aag gcg age 
Val He Thr Thr Asp lie Ser Glu Met Gly Ala Asn Phe Lys Ala Ser 
1915 1920 1925 



5874 



agg gtg att gac age egg aag agt gtg aaa cca ace ate ata aca gaa 
Arg Val He Asp Ser Arg Lys Ser Val Lys Pro Thr He He Thr Glu 
1930 1935 1940 



5922 



gga gaa ggg aga gtg ate ctg gga gaa cca tct gca gtg aca gca get 
Gly Glu Gly Arg Val He Leu Gly Glu Pro Ser Ala Val Thr Ala Ala 
1945 1950 1955 



5970 



agt gee gee cag aga cgt gga cgt ate ggt aga aat ccg teg caa gtt 
Ser Ala Ala Gin Arg Arg Gly Arg He Gly Arg Asn Pro Ser Gin Val 
1960 1965 1970 



6018 



ggt gat gag tac tgt tat ggg ggg cac acg aat gaa gac gac teg aac 
Gly Asp Glu Tyr Cys Tyr Gly Gly His Thr Asn Glu Asp Asp Ser Asn 
1975 1980 1985 1990 



6066 



ttc gee cat tgg act gag gca cga ate atg ccg gac aac ate aac atg 
Phe Ala His Trp Thr Glu Ala Arg He Met Pro Asp Asn He Asn Met 
1995 2000 2005 



6114 



cca aac gga ctg ate get caa ttc tac caa cca gag cgt gag aag gta 
Pro Asn Gly Leu He Ala Gin Phe Tyr Gin Pro Glu Arg Glu Lys Val 
2010 2015 2020 



6162 



tat ace atg gag ggg gaa tac egg etc aga gga gaa gag agg aaa aac 
Tyr Thr Met Glu Gly Glu Tyr Arg Leu Arg Gly Glu Glu Arg Lys Asn 
2025 2030 2035 



6210 



ttt ctg gaa ctg ttg agg act gca gat ctg cca gtt tgg ctg get tac 
Phe Leu Glu Leu Leu Arg Thr Ala Asp Leu Pro Val Trp Leu Ala Tyr 
2040 2045 2050- 



6258 



aag gtt gca gcg get gga gtg tea tac cac gac egg agg tgg tgc ttt 
Lys Val Ala Ala Ala Gly Val Ser Tyr His Asp Arg Arg Trp Cys Phe 
2055 2060 2065 2070 



6306 



gat ggt cct agg aca aac aca att tta gaa gac aac aac gaa gtg gaa 6354 
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Asp Gly Pro Arg Thr Asn Thr lie Leu Glu Asp Asn Asn Glu Val Glu 
2075 2080 2085 

gtc ate acg aag ctt ggt gaa agg aag att ctg agg ccg cgc tgg att 6402 

Val lie Thr Lys Leu Gly Glu Arg Lys lie Leu Arg Pro Arg Trp lie 
2090 2095 2100 



gac gec agg gtg tac teg gat cac cag gca eta aag gcg ttc aag gae 
Asp Ala Arg Val Tyr Ser Asp Hi's Gin Ala Leu Lys Ala Phe Lys Asp 
2105 2110 2115 



6450 



ttc gec teg gga aaa cgt tct cag ata ggg etc att gag gtt ctg gga 
Phe Ala Ser Gly Lys Arg Ser Gin lie Gly Leu lie Glu Val Leu Gly 
2120 2125 2130 



6498 



aag atg cct gag cac ttc atg ggg aag aca tgg gaa gca ctt gac acc 
Lys Met Pro Glu His Phe Met Gly Lys Thr Trp Glu Ala Leu Asp Thr 
2135 2140 2145 2150 



6546 



atg tac gtt gtg gee act gca gag aaa gga gga aga get cac aga atg 
Met Tyr Val Val Ala Thr Ala Glu Lys Gly Gly Arg Ala His Arg Met 
2155 2160 2165 



6594 



gee ctg gag gaa ctg cca gat get ctt cag aca att gec ttg att gee 
Ala Leu Glu Glu Leu Pro Asp Ala Leu Gin Thr lie Ala Leu lie Ala 
2170 2175 2180 



6642 



tta ttg agt gtg atg acc atg gga gta ttc ttc etc etc atg cag egg 
Leu Leu Ser Val Met Thr Met Gly Val Phe Phe Leu Leu Met Gin Arg 
2185 2190 2195 



6690 



aag ggc att gga aag ata ggt ttg gga ggc get gtc ttg gga gtc gcg 
Lys Gly He Gly Lys He Gly Leu Gly Gly Ala Val Leu Gly Val Ala 
2200 2205 2210 



6738 



acc ttt ttc tgt tgg atg get gaa gtt cca gga acg aag ate gee gga 
Thr Phe Phe Cys Trp Met Ala Glu Val Pro Gly Thr Lys He Ala Gly 
2215 2220 2225 2230 



6786 



atg ttg ctg etc tec ctt etc ttg atg att gtg eta att cct gag cca 
Met Leu Leu Leu Ser Leu Leu Leu Met He Val Leu He Pro Glu Pro 
2235 2240 2245 



6834 



gag aag caa cgt teg cag aca gac aac cag eta gee gtg ttc ctg att 
Glu Lys Gin Arg Ser Gin Thr Asp Asn Gin Leu Ala Val Phe Leu He 
2250 2255 2260 



6882 



tgt gtc atg acc ctt gtg age gca gtg gca gee aac gag atg ggt tgg 
Cys Val Met Thr Leu Val Ser Ala Val Ala Ala Asn Glu Met Gly Trp 
2265 2270 2275 



6930 



eta gac aag acc aag agt gac ata age agt ttg ttt ggg caa aga att 6978 

Leu Asp Lys Thr Lys Ser Asp He Ser Ser Leu Phe Gly Gin Arg He 
2280 2285 2290 

gag gtc aag gag aat ttc age atg gga gag ttt ctt ctg gac ttg agg 7026 

Glu Val Lys Glu Asn Phe Ser Met Gly Glu Phe Leu Leu Asp Leu Arg 
2295 2300 2305 2310 



ccg gca aca gee tgg tea ctg tac get gtg aca aca gcg gtc etc act 
Pro Ala Thr Ala Trp Ser Leu Tyr Ala Val Thr Thr Ala Val Leu Thr 



7074 



n 2823224 

2315 2320 2325 

cca ctg eta aag cat ttg ate acg tea gat tac ate aac acc tea ttg 7122 
Pro Leu Leu Lys His Leu He Thr Ser Asp Tyr He Asn Thr Ser Leu 
2330 2335 2340 

acc tea ata aac gtt cag gca agt gca eta ttc aca etc gcg cga ggc 7170 
Thr Ser He Asn Val Gin Ala Ser Ala Leu Phe Thr Leu Ala Arg Gly 
2345 2350 2355 

ttc ccc ttc gtc gat gtt gga gtg teg get etc ctg eta gca gec gga 7218 
Phe Pro Phe Val Asp Val Gly Val Ser Ala Leu Leu Leu Ala Ala Gly 
2360 2365 2370 

tgc tgg gga caa gtc acc etc acc gtt acg gta aca gcg gca aca etc 7266 
Cys Trp Gly Gin Val Thr Leu Thr Val Thr Val Thr Ala Ala Thr Leu 
2375 2380 2385 2390 

ctt ttt tgc cac tat gee tac atg gtt ccc ggt tgg caa get gag gca 7314 
Leu Phe Cys His Tyr Ala Tyr Met Val Pro Gly Trp Gin Ala Glu Ala 
2395 2400 2405 

atg cgc tea gec cag egg egg aca gcg gee gga ate atg aaa aac get 7362 
Met Arg Ser Ala Gin Arg Arg Thr Ala Ala Gly He Met Lys Asn Ala 
2410 2415 2420 

gta gtg gat ggc ate gtg gec acg gac gtc cca gaa tta gag cgc acc 7410 
Val Val Asp Gly lie Val Ala Thr Asp Val Pro Glu Leu Glu Arg Thr 
2425 2430 2435 

aca ccc ate atg cag aag aaa gtt gga cag ate atg ctg ate ttg gtg 7458 
Thr Pro He Met Gin Lys Lys Val Gly Gin He Met Leu He Leu Val 
2440 2445 2450 

tct eta get gca gta gta gtg aac ccg tct gtg aag aca gta cga gaa 7506 
Ser Leu Ala Ala Val Val Val Asn Pro Ser Val Lys Thr Val Arg Glu 
2455 2460 2465 2470 

gec gga att ttg ate acg gee gca gcg gtg acg ctt tgg gag aat gga 7554 
Ala Gly He Leu He Thr Ala Ala Ala Val Thr Leu Trp Glu Asn Gly 
2475 2480 2485 

gca age tct gtt tgg aac gca aca act gec ate gga etc tgc cac ate 7602 
Ala Ser Ser Val Trp Asn Ala Thr Thr Ala He Gly Leu Cys His He 
2490 2495 2500 

atg cgt ggg ggt tgg ttg tea tgt eta tec ata aca tgg aca etc ata 7650 
Met Arg Gly Gly Trp Leu Ser Cys Leu Ser He Thr Trp Thr Leu He 
2505 2510 2515 

aag aac atg gaa aaa cca gga eta aaa aga ggt ggg gca aaa gga cgc 7698 
Lys Asn Met Glu Lys Pro Gly Leu Lys Arg Gly Gly Ala Lys Gly Arg 
2520 2525 2530 

acc ttg gga gag gtt tgg aaa gaa aga etc aac cag atg aca aaa gaa 7746 
Thr Leu Gly Glu Val Trp Lys Glu Arg Leu Asn Gin Met Thr Lys Glu 
2535 2540 2545 2550 

gag ttc act agg tac cgc aaa gag gee ate ate gaa gtc gat cgc tea 7794 
Glu Phe Thr Arg Tyr Arg Lys Glu Ala He He Glu Val Asp Arg Ser 
2555 2560 2565 



* 
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gcg gca aaa cac gcc agg aaa gaa ggc aat gtc act gga ggg cat tea 784 2 
Ala Ala Lys His Ala Arg Lys Glu Gly Asn Val Thr Gly Gly His Ser 
2570 2575 2580 

gtc tct agg ggc aca gca aaa ctg aga tgg ctg gtc gaa egg agg ttt 7 890 
Val Ser Arg Gly Thr Ala Lys Leu Arg Trp Leu Val Glu Arg Arg Phe 
2585 2590 2595 

etc gaa ccg gtc gga aaa gtg att gac ctt gga tgt gga aga ggc ggt 7938 
Leu Glu Pro Val Gly Lys Val lie Asp Leu Gly Cys Gly Arg Gly Gly 
2600 2605 2610 

tgg tgt tac tat atg gca acc caa aaa aga gtc caa gaa gtc aga ggg 7986 • 
Trp Cys Tyr Tyr Met Ala Thr Gin Lys Arg Val Gin Glu Val Arg Gly 
2615 2620 2625 2630 

tac aca aag ggc ggt ccc gga cat gaa gag ccc caa eta gtg caa agt 80 34 
Tyr Thr Lys Gly Gly Pro Gly His Glu Glu Pro Gin Leu Val Gin Ser 
2635 2640 2645 

tat gga tgg aac att gtc acc atg aag agt gga gtg gat gtg ttc tac 8082 
Tyr Gly Trp Asn lie Val Thr Met Lys Ser Gly Val Asp Val Phe Tyr 
2650 2655 2660 

aga cct tct gag tgt tgt gac acc etc ctt tgt gac ate gga gag tec 8130 
Arg Pro Ser Glu Cys Cys Asp Thr Leu Leu Cys Asp lie Gly Glu Ser 
• 2665 2670 2675 

teg tea agt get gag gtt gaa gag cat agg acg att cgt gtc ctt gaa 8178 
Ser Ser Ser Ala Glu Val Glu Glu His Arg Thr lie Arg Val Leu Glu 
2680 2685 2690 

atg gtt gag gac tgg ctg cac cga ggg cca agg gaa ttt tgc gtg aag 8226 
Met Val Glu Asp Trp Leu His Arg Gly Pro Arg- Glu Phe Cys Val Lys 
2695 2700 2705 2710 

gtg etc tgc ccc tac atg ccg aaa gtc ata gag aag atg gag ctg etc 8274 
Val Leu Cys Pro Tyr Met Pro Lys Val lie Glu Lys Met Glu Leu Leu 
2715 2720 • 2725 

caa cgc egg tat ggg ggg gga ctg gtc aga aac cca etc tea egg aat 8322 
Gin Arg Arg Tyr Gly Gly Gly Leu Val Arg Asn Pro Leu Ser Arg Asn 
2730 2735 2740 

tec acg cac gag atg tat tgg gtg agt cga get tea ggc aat gtg gta 8370 
Ser Thr His Glu Met Tyr Trp Val Ser Arg Ala Ser Gly Asn Val Val 
2745 2750 2755 

cat tea gtg aat atg acc age cag gtg etc eta gga aga atg gaa aaa 8418 
His Ser Val Asn Met Thr Ser Gin Val Leu Leu Gly Arg Met Glu Lys 
2760 2765 2770 

agg acc tgg aag gga ccc caa tac gag gaa gat gta aac ttg gga age 8466 
Arg Thr Trp Lys Gly Pro Gin Tyr Glu Glu Asp Val Asn Leu Gly Ser 
2775 2780 2785 2790 

gga acc agg gcg gtg gga aaa ccc ctg etc aac tea gac acc agt aaa 8514 
Gly Thr Arg Ala Val Gly Lys Pro Leu Leu Asn Ser Asp Thr Ser Lys 
2795 2800 2805 



* 
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ate aac aac agg att gaa cga etc agg cgt gag tac agt teg acg tgg 
He Asn Asn Arg He Glu Arg Leu Arg Arg Glu Tyr Ser Ser Thr- Trp 
2810 2815 2820 



8562 



cac cac gat gag aac cac cca tat aga acc tgg aac tat cac ggc agt 
His His Asp Glu Asn His Pro Tyr Arg Thr Trp Asn Tyr His Gly Ser 
2825 2830 2835 



8610 



tat gat gtg aag ccc aca ggc tec gec agt teg ctg gtc aat gga gtg 
Tyr Asp Val Lys Pro Thr Gly Ser Ala Ser Ser Leu Val Asn Gly Val 
2840 2845 2850 



8658 



gtc agg etc etc tea aaa cca tgg gac acc ate acg aat gtt acc acc 
Val Arg Leu Leu Ser Lys Pro Trp Asp Thr He Thr Asn Val Thr Thr 
2855 2860 2865 2870 



8706 



atg gec atg act gac act act ccc ttc ggg cag cag cga gtg ttc aaa 
Met Ala Met Thr Asp Thr Thr Pro Phe Gly Gin Gin Arg Val Phe Lys 
2875 2880 2885 



8754 



gag aag gtg gac acg aaa get cct gaa ccg cca gaa gga gcg aag tac 
Glu Lys Val Asp Thr Lys Ala Pro Glu Pro Pro Glu Gly Ala Lys Tyr 
2890 2895 2900 



8802 



gtg etc aac gag acc acc aac tgg ttg tgg gcg ttt ttg gee aga gaa 
Val Leu Asn Glu Thr Thr Asn Trp Leu Trp Ala Phe Leu Ala Arg Glu 
2905 2910 2915 



8850 



aaa cgt ccc aga atg tgc tct cga gag gaa ttc ata aga aag gtc aac 
Lys Arg Pro Arg Met Cys Ser Arg Glu Glu Phe He Arg Lys Val Asn 
2920 2925 2930 



8898 



age aat gca get ttg ggt gec atg ttt gaa gag cag aat caa tgg agg 
Ser Asn Ala Ala Leu Gly Ala Met Phe Glu Glu Gin Asn Gin Trp Arg 
2935 2940 2945 2950 



8946 



age gee aga gaa gca gtt gaa gat cca aaa ttt tgg gag atg gtg gat 
Ser Ala Arg Glu Ala Val Glu Asp Pro Lys Phe Trp Glu Met Val Asp 
2955 2960 2965 



8994 



gag gag cgc gag gca cat ctg egg ggg gaa tgt cac act tgc att tac 
Glu Glu Arg Glu Ala His Leu Arg Gly Glu Cys His Thr Cys He Tyr 
. 2970 2975 2980 



9042 



aac atg atg gga aag aga gag aaa aaa ccc gga gag ttc gga aag gec 
Asn Met Met Gly Lys Arg Glu Lys Lys Pro Gly Glu Phe Gly Lys Ala 
2985 2990 2995 



9090 



aag gga age aga gee att tgg ttc atg tgg etc gga get cgc ttt ctg 
Lys Gly Ser Arg Ala lie Trp Phe Met Trp Leu Gly Ala Arg Phe Leu 
.3000 3005 3010 



9138 



gag ttc gag get ctg ggt ttt etc aat gaa gac cac tgg ctt gga aga 
Glu Phe Glu Ala Leu Gly Phe Leu Asn Glu Asp His Trp Leu Gly Arg 
3015 3020 3025 3030 



9186 



aag aac tea gga gga ggt gtc gag ggc ttg ggc etc caa aaa ctg ggt 
Lys Asn Ser Gly Gly Gly Val Glu Gly Leu Gly Leu Gin Lys Leu Gly 
3035 3040 3045 



9234 



tac ate ctg cgt gaa gtt ggc acc egg cct ggg ggc aag ate tat get 



9282 
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Tyr lie Leu Arg Glu Val Gly Thr Arg Pro Gly Gly Lys lie Tyr Ala 
3050 3055 3060 



gat gac aca get ggc tgg gac acc cgc ate acg aga get gac ttg gaa 
Asp Asp Thr Ala Gly Trp Asp Thr Arg He Thr Arg Ala Asp Leu Glu 
3065 3070 3075 



9330 



aat gaa get aag gtg ctt gag ctg ctt gat ggg gaa cat egg cgt ctt 
Asn Glu Ala Lys Val Leu Glu Leu Leu Asp Gly Glu His Arg Arg Leu 
3080 3085 3090 



9378 



gee agg gee ate att gag etc acc tat cgt cac aaa gtt gtg aaa gtg 
Ala Arg Ala He He Glu Leu Thr Tyr Arg His Lys Val Val Lys Val 
3095 3100 3105 31 1 0 



9426 



atg cgc ccg get get gat gga aga acc gtc atg gat gtt ate tec aga 
Met Arg Pro Ala Ala Asp Gly Arg Thr Val Met Asp Val He Ser Arg 
3115 3120 3125 



9474 



gaa gat cag agg ggg agt gga caa gtt gtc acc tac gec eta aac act 
Glu Asp Gin Arg Gly Ser Gly Gin Val Val Thr Tyr Ala Leu Asn Thr 
3130 3135 3140 



9522 



ttc acc aac ctg gee gtc cag ctg gtg agg atg atg gaa ggg gaa gga 
Phe Thr Asn Leu Ala Val Gin Leu Val Arg Met Met Glu Gly Glu Gly 
3145 3150 3155 



9570 



gtg att ggc cca gat gat gtg gag aaa etc aca aaa ggg aaa gga ccc 
Val He Gly Pro Asp Asp Val Glu Lys Leu Thr Lys Gly Lys Gly Pro 
3160 3165 3170 



9618 



aaa gtc agg acc tgg ctg ttt gag aat ggg gaa gaa aga etc age cgc 
Lys Val Arg Thr Trp Leu Phe Glu Asn Gly Glu Glu Arg Leu Ser Arg 
3175 3180 3185 3190 



9666 



atg get gtc agt gga gat gac tgt gtg gta aag ccc ctg gac gat cgc 
Met Ala Val Ser Gly Asp Asp Cys Val Val Lys Pro Leu Asp Asp Arg 
3195 3200 3205 



9714 



ttt gee acc teg etc cac ttc etc aat get atg tea aag gtt cgc aaa 
Phe Ala Thr Ser Leu His Phe Leu Asn Ala Met Ser Lys Val Arg Lys 
3210 3215 3220 



9762 



gac ate caa gag tgg aaa ccg tea act gga tgg tat gat tgg cag cag 
Asp He Gin Glu Trp Lys Pro Ser Thr Gly Trp Tyr Asp Trp Gin Gin 
3225 3230 3235 



9810 



gtt cca ttt tgc tea aac cat ttc act gaa ttg ate atg aaa gat gga 
Val Pro Phe Cys Ser Asn His Phe Thr Glu Leu He Met Lys Asp Gly 
3240 3245 3250 



9858 



aga aca ctg gtg gtt cca tgc cga gga cag gat gaa ttg gta ggc aga 
Arg Thr Leu Val Val Pro Cys Arg Gly Gin Asp Glu Leu Val Gly Arg 
3255 3260 3265 3270 



9906 



get cgc ata tct cca ggg gee gga tgg aac gtc cgc gac act get tgt 
Ala Arg lie Ser Pro Gly Ala Gly Trp Asn Val Arg Asp Thr Ala Cys 
3275 3280 3285 



9954 



ctg get aag tct tat gee cag atg tgg ctg ctt ctg tac ttc cac aga 
Leu Ala Lys Ser Tyr Ala Gin Met Trp Leu Leu Leu Tyr Phe His Arg 



10002 
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3290 3295 3300 

aga gac ctg egg etc atg gee aac gee att tgc tec get gtc cct gtg 10050 

Arg Asp Leu Arg Leu Met Ala Asn Ala He Cys Ser Ala Val Pro Val 
3305 3310 3315 



aat tgg gtc cct acc gga aga ace acg tgg tec ate cat gca gga gga 10098 
Asn Trp Val Pro Thr GlyArg Thr Thr Trp Ser He His Ala Gly Gly 
3320 3325 3330 

gag tgg atg aca aca gag gac atg ttg gag gtc tgg aac cgt gtt tgg 10146 
Glu Trp Met Thr Thr Glu Asp Met Leu Glu Val Trp Asn Arg Val Trp 
3335 3340 3345 3350 

ata gag gag aat gaa tgg atg gaa gac aaa acc cca gtg gag aaa tgg 10194' 
He Glu Glu Asn Glu Trp Met Glu Asp Lys Thr Pro Val Glu Lys Trp 
3355 3360 3365 

agt gac gtc cca tat tea gga aaa cga gag gac ate tgg tgt ggc age 10242- 
Ser Asp Val Pro Tyr Ser Gly Lys Arg Glu Asp He Trp Cys Gly Ser 
3370 3375 3380 

ctg att ggc aca aga gee cga gee acg tgg gca gaa aac ate cag gtg 10290 
Leu He Gly Thr Arg Ala Arg Ala Thr Trp Ala Glu Asn He Gin Val 
3385 3390 3395 

get ate aac caa gtc aga gca ate ate gga gat gag aag tat gtg gat 10338 
Ala He Asn Gin Val Arg Ala He He Gly Asp Glu Lys Tyr Val Asp 
3400 3405 3410 

tac atg agt tea eta aag aga tat gaa gac aca act ttg gtt gag gac 10386 
Tyr Met Ser Ser Leu Lys Arg Tyr Glu Asp Thr Thr Leu Val Glu Asp 
3415 3420 3425 3430 

aca gta ctg tagatattta atcaattgta aatagacaat ataagtatgc 10435 
Thr Val Leu 



ataaaagtgt 


agttttatag 


t agt att tag 


tggtgttagt 


gtaaatagtt 


aagaaaattt 


10495 


tgaggagaaa 


gtcaggcegg 


gaagttcccg 


ccaccggaag 


ttgagtagac 


ggtgctgcct 


10555 


gcgactcaac 


cccaggagga 


ctgggtgaac 


aaagecgega 


agtgatccat 


gtaagccctc 


1061 5 


agaacegtet 


eggaaggagg 


accccacatg 


ttgtaacttc 


aaagcccaat 


gtcagaccac 


10675 


getaeggegt 


gctactctgc 


ggagagtgca 


gtctgegata 


gtgccccagg 


aggactgggt 


10735 


taacaaaggc 


aaaccaacgc 


cccacgcggc 


cctagccccg 


gtaatggtgt 


taaccagggc 


10795 


gaaaggacta 


gaggttagag 


gagaccccgc 


ggtttaaagt 


gcacggccca 


gectgactga 


1 0855 


agctgtaggt 


caggggaagg 


actagaggtt 


agtggagacc 


ccgtgccaca 


aaacaccaca 


10915 


acaaaacagc 


atattgacac 


ctgggataga 


ctaggagatc 


ttctgctctg 


cacaaccagc 


10975 


cacacggcac 


agtgcgccga 


caatggtggc 


tggtggtgcg 


agaacacagg 


atct 


1 1029 



<210> 2 
<211> 3433 
<212> PRT 
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<213> Flavivirus sp . 
<400> 2 

Met Ser Lys Lys Pro Gly Gly Pro Gly Lys Ser Arg Ala Val Asn Met 
15 10 15 

Leu Lys Arg Gly Met Pro Arg Val Leu Ser Leu lie Gly Leu Lys Arg 
20 25 30 

Ala Met Leu Ser Leu lie Asp Gly Lys Gly Pro He Arg Phe Val Leu 
35 40 45 

Ala Leu Leu Ala Phe Phe Arg Phe Thr Ala He Ala Pro Thr Arg Ala 
50 55 60 

Val Leu Asp Arg Trp Arg Gly Val Asn Lys Gin Thr Ala Met Lys His 
65 70 75 80 

Leu Leu Ser Phe Lys Lys Glu Leu Gly Thr Leu Thr Ser Ala He Asn 
85 90 95 

Arg Arg Ser Ser Lys Gin Lys Lys Arg Gly Gly Lys Thr Gly He Ala 
100 105 110 

Val Met He Gly Leu He Ala Ser Val Gly Ala Val Thr Leu Ser Asn- 
115 120 125 

Phe Gin Gly Lys Val Met Met Thr Val Asn Ala Thr Asp Val Thr Asp 
130 135 140 

Val He Thr He Pro Thr Ala Ala Gly Lys Asn Leu Cys He Val Arg 
145 150 155 160 

Ala Met Asp Val Gly Tyr Met Cys Asp Asp Thr He Thr Tyr Glu Cys 
165 170 175 

Pro Val Leu Ser Ala Gly Asn Asp Pro Glu Asp He Asp Cys Trp Cys 
180 185 190 

Thr Lys Ser Ala Val Tyr Val Arg Tyr Gly Arg Cys Thr Lys Thr Arg 
195 200 205 

His Ser Arg Arg Ser Arg Arg Ser Leu Thr Val Gin Thr His Gly Glu 
210 215 220 

Ser Thr Leu Ala Asn Lys Lys Gly Ala Trp Met Asp Ser Thr Lys Ala 
225 230 235 240 

Thr Arg Tyr Leu Val Lys Thr Glu Ser Trp He Leu Arg Asn Pro Gly 
245 250 255 

Tyr Ala Leu Val Ala Ala Val lie Gly Trp Met Leu Gly Ser Asn Thr 
260 265 270 

Met Gin Arg Val Val Phe Val Val Leu Leu Leu Leu Val Ala Pro Ala 
275 280 285 

Tyr Ser Phe Asn Cys Leu Gly Met Ser Asn Arg Asp Phe Leu Glu Gly 
290 295 300 



Val Ser Gly Ala Thr Trp Val Asp Leu Val Leu Glu Gly Asp Ser Cys 
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305 310 315 320 

Val Thr lie Met Ser Lys Asp Lys Pro Thr lie Asp Val Lys Met Met 
325 330 335 

Asn Met Glu Ala Ala Asn Leu Ala Glu Val Arg Ser Tyr Cys Tyr Leu 
340 345 350 

Ala Thr Val Ser Asp Leu Ser Thr Lys Ala Ala Cys Pro Thr Met Gly 
355 360 365 

Glu Ala His Asn Asp Lys Arg Ala Asp Pro Ala Phe Val Cys Arg Gin 
370 375 380 

Gly Val Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys 
385 390 395 400 

Gly Ser lie Asp Thr Cys Ala Lys Phe Ala Cys Ser Thr Lys Ala He 
405 410 415 

Gly Arg Thr He Leu Lys Glu Asn He Lys Tyr Glu Val Ala He Phe 
420 425 . 430 

Val His Gly Pro Thr Thr Val Glu Ser His Gly Asn Tyr Ser Thr Gin 
435 440 445 

Val Gly Ala Thr Gin Ala Gly Arg Phe Ser He Thr Pro Ala Ala Pro 
450 455 460 

Ser Tyr Thr Leu Lys Leu Gly Glu Tyr Gly Glu Val Thr Val Asp Cys 
465 470 475 480 

Glu Pro Arg Ser Gly He Asp Thr Asn Ala Tyr Tyr Val Met Thr Val 
485 490 495 

Gly Thr Lys Thr Phe Leu Val His Arg Glu Trp Phe Met Asp Leu Asn 
500 505 510 

Leu Pro Trp Ser Ser Ala Gly Ser Thr Val Trp Arg Asn Arg Glu Thr 
515 520 525 

Leu Met Glu Phe Glu Glu Pro His Ala Thr Lys Gin Ser Val lie Ala 
. 530 535 540 

Leu Gly Ser Gin Glu Gly Ala Leu His Gin Ala Leu Ala Gly Ala He 
545 550 555 560 

Pro Val Glu Phe Ser Ser Asn Thr Val Lys Leu Thr Ser Gly His Leu 
565 570 575 

Lys Cys Arg Val Lys Met Glu Lys Leu Gin Leu Lys Gly Thr Thr Tyr 
580 585 590 

Gly Val Cys Ser Lys Ala Phe Lys Phe Leu Gly Thr Pro Ala Asp Thr 
595 600 605 

Gly His Gly Thr Val Val Leu Glu Leu Gin Tyr Thr Gly Thr Asp Gly 
610 615 620 

Pro Cys Lys Val Pro He Ser Ser Val Ala Ser Leu Asn Asp Leu Thr 
625 630 635 640 
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Pro Val Gly Arg Leu Val Thr Val Asn Pro Phe Val Ser Val Ala Thr 
645 650 655 

Ala Asn Ala Lys Val Leu lie Glu Leu Glu Pro Pro Phe Gly Asp Ser 

660 665 670 

Tyr lie Val Val Gly Arg Gly Glu Gin Gin lie Asn His His Trp His 

675 680 685 

Lys Ser Gly Ser Ser lie Gly Lys Ala Phe Thr Thr Thr Leu Lys Gly 



Val Gly Gly Val Phe Thr Ser Val Gly Lys Ala Val His Gin Val Phe 
725 730 735 

Gly Gly Ala Phe Arg Ser Leu Phe Gly Gly Met Ser Trp lie Thr Gin 
740 745 750 

Gly Leu Leu Gly Ala Leu Leu Leu Trp Met Gly lie Asn Ala Arg Asp 
755 760 765 

Arg Ser lie Ala Leu Thr Phe Leu Ala Val Gly Gly Val Leu Leu Phe 
770 775 780 

Leu Ser Val Asn Val His Ala Asp Thr Gly Cys Ala lie Asp lie Ser 
785 790 795 800 

Arg Gin Glu Leu Arg Cys Gly Asn Gly Val Phe lie His Asn Asp Val 
805 810 815 

Glu Ala Trp Met Asp Arg Tyr Lys Tyr Tyr Pro Glu Thr Pro Gin Gly 
820 825 830 

Leu Ala Lys lie. lie Gin Lys Ala His Lys Glu Gly Val Cys Gly Leu 
835 840 845 

Arg Ser Val Ser Arg Leu Glu His Gin Met Trp Glu Ala Val Lys Asp 
850 855 860 

Glu Leu Asn Thr Leu Leu Lys Glu Asn Gly Val Asp Leu Ser Val Val 
865 870 875 880 

Val Glu Lys Gin Glu Gly Met Tyr Lys Ser Ala Pro Lys Arg Leu Thr 
885 890 895 

Ala Thr Thr Glu Lys Leu Glu lie Gly Trp Lys Ala Trp Gly Lys Ser 
900 905 910 

lie Leu Phe Ala Pro Glu Leu Ala Asn Asn Thr Phe Val Val Asp Gly 
915 920 925 

Pro Giu Thr Lys Glu Cys Pro Thr Gin Asn Arg Ala Trp Asn Ser Leu 
930 935 940 



690 



695 



700 



Ala Gin Arg Leu Ala Ala Leu Gly Asp Thr Ala Trp Asp Phe Gly Ser 
705 710 715 720 



Glu Val Glu Asp Phe Gly Phe Gly Leu Thr Ser Thr Arg Met Phe Leu 
945 950 955 960 



19 2823224 



Lys Val Arg Glu Ser Asn Thr Thr Glu Cys Asp Ser Lys lie lie Gly 
965 970 975 

Thr Ala Val Lys Asn Asn Leu Ala lie His Ser Asp Leu Ser Tyr Trp 
980 985 990 

lie Glu Ser Arg Leu Asn Asp Thr Trp Lys Leu Glu Arg Ala Val Leu 
995 1000 1005 

Gly Glu Val Lys Ser Cys Thr Trp Pro Glu Thr His Thr Leu Trp Gly 
1010 .1015 1020 

Asp Gly lie Leu Glu Ser Asp Leu lie lie Pro Val Thr Leu Ala Gly 
025 1030 1035 1040 

Pro Arg Ser Asn His Asn Arg Arg Pro Gly Tyr Lys Thr Gin Asn Gin 
1045 1050 1055 

Gly Pro Trp Asp Glu Gly Arg Val Glu lie Asp Phe Asp Tyr Cys Pro 
1060 1065 1070 

Gly Thr Thr Val Thr Leu Ser Glu Ser Cys Gly His Arg Gly Pro Ala 
1075 1080 1085 

Thr Arg Thr Thr Thr Glu Ser Gly Lys Leu lie Thr Asp Trp Cys Cys 
1090 1095 1100 

Arg Ser Cys Thr Leu Pro Pro Leu Arg Tyr Gin Thr Asp Ser Gly Cys 
105 1110 1115 1120 

Trp Tyr Gly Met Glu lie Arg Pro Gin Arg His Asp Glu Lys Thr Leu 
1125 1130 1135 

Val Gin Ser Gin Val Asn Ala Tyr Asn Ala Asp Met lie Asp Pro Phe 
1140 1145 1150 

Gin Leu Gly Leu Leu Val Val Phe Leu Ala Thr Gin Glu Val Leu Arg 
1155 1160 1165 

Lys Arg Trp Thr Ala Lys lie Ser Met Pro Ala lie Leu lie Ala Leu 
1170 1175 1180 

Leu Val Leu Val Phe Gly Gly He Thr Tyr Thr Asp Val Leu Arg Tyr 
185 1 190 1 195 1 200 

Val He Leu Val Gly Ala Ala Phe Ala Glu Ser Asn Ser Gly Gly Asp 
1205 1210 1215 

Val Val His Leu Ala Leu Met Ala Thr Phe Lys He Gin Pro Val Phe 
1220 1225 1230 

Met Val Ala Ser Phe Leu Lys Ala Arg Trp Thr Asn Gin Glu Asn He 
1235 1240 1245 

Leu Leu Met Leu Ala Ala Val Phe Phe Gin Met Ala Tyr His Asp Ala 
1250 1255 1260 

Arg Gin He Leu Leu Trp Glu He Pro Asp Val Leu Asn Ser Leu Ala 
265 1 270 1275 1 280 

Val Ala Trp Met lie Leu Arg Ala lie Thr Phe Thr Thr Thr Ser Asn 
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1285 1290 1295 

Val Val Val Pro Leu Leu Ala Leu Leu Thr Pro Arg Leu Arg Cys Leu 
1300 1305 1310 

Asn Leu Asp Val Tyr Arg lie Leu Leu Leu Met Val Gly lie Gly Ser 
1315 1320 1325 

Leu lie Arg Glu Lys Arg Ser Ala Ala Ala Lys Lys Lys Gly Ala Ser 
1330 1335 1340 

Leu Leu Cys Leu Ala Leu Ala Ser Thr Gly Leu Phe Asn Pro Met lie 
345 1350 1355 1360 

Leu Ala Ala Gly Leu lie Ala Cys Asp Pro Asn Arg Lys Arg Gly Trp 
1365 ' 1370 ^ 1375 

Pro Ala Thr Glu Val Met Thr Ala Val Gly Leu Met Phe Ala lie Val 
1380 , 1385 1390 

Gly Gly Leu Ala Glu Leu Asp lie Asp Ser Met Ala lie Pro Met Thr 
1395 1400 1405 

lie Ala Gly Leu Met Phe Ala Ala Phe Val lie Ser Gly Lys Ser Thr 
1410 1415 1420 

Asp Met Trp lie Glu Arg Thr Ala Asp lie Ser Trp Glu Ser Asp Ala 
425 1430 1435 1440 

Glu lie Thr Gly Ser Ser Glu Arg Val Asp Val Arg Leu Asp Asp Gly 
1445 1450 1455 

Glu Asn Phe Gin Leu Met Asn Asp Pro Gly Ala Pro Trp Lys lie Trp 
1460 1465 1470 

Met Leu Arg Met Val Cys Leu Ala lie Ser Ala Tyr Thr Pro Trp Ala 
1475 1480 1485 

He Leu Pro Ser Val Val Gly Phe Trp He Thr Leu Gin Tyr Thr Lys 
1490 1495' 1500 

Arg Gly Gly Val Leu Trp Asp Thr Pro Ser Pro Lys Glu Tyr Lys Lys 
505 1510 1515 1520 

Gly Asp Thr Thr Thr Gly Val Tyr Arg He Met Thr Arg Gly Leu Leu 
1525 1530 1535 

Gly Ser Tyr Gin Ala Gly Ala Gly Val Met Val Glu Gly Val Phe His 
1540 1545 1550 

Thr Leu Trp His Thr Thr Lys Gly Ala Ala Leu Met Ser Gly Glu Gly 
1555 1560 1565 

Arg Leu Asp Pro Tyr Trp Gly Ser Val Lys Glu Asp Arg Leu Cys Tyr 
1570 1575 1580 

Gly Gly Pro Trp Lys Leu Gin His Lys Trp Asn Gly Gin Asp Glu Val 
585 1590 1595 1600 



Gin Met He Val Val Glu Pro Gly Lys Asn Val Lys Asn Val Gin Thr 
1605 1610 1615 
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Lys Pro Gly Val Phe Lys Thr Pro Glu Gly Glu lie Gly Ala Val Thr 
1620 1625 1630 

Leu Asp Phe Pro Thr Gly Thr Ser Gly Ser Pro He Val Asp Lys Asn 
1635 1640 1645 

Gly Asp Val He Gly Leu Tyr Gly Asn Gly Val He Met Pro Asn Gly 
1650 1655 1660 

Ser Tyr He Ser Ala He Val Gin Gly Glu Arg Met Asp Glu Pro He 
665 1670 1675 1680 

Pro Ala Gly Phe Glu Pro Glu Met Leu Arg Lys Lys Gin He Thr Val 
1685 1690 1695 

Leu Asp Leu His Pro Gly Ala Gly Lys Thr Arg Arg He Leu Pro Gin 
1700 1705 1710 

He He Lys Glu Ala He Asn Arg Arg Leu Arg Thr Ala Val Leu Ala 
1715 1720 1725 

Pro Thr Arg Val Val Ala Ala Glu Met Ala Glu Ala Leu Arg Gly Leu 
1730 1735 1740 

Pro He Arg Tyr Gin Thr Ser Ala Val Pro Arg Glu His Asn Gly Asn 
745 1750 1755 1760 

Glu lie Val Asp Val Met Cys Kis Ala Thr Leu Thr His Arg Leu Met 
1765 1770 1775 

Ser Pro His Arg Val Pro Asn Tyr Asn Leu Phe Val Met Asp Glu Ala 
1780 1785 1790 

His Phe Thr Asp Pro Ala Ser He Ala Ala Arg Gly Tyr He Ser Thr 
1795 1800 1805 

Lys Val Glu Leu Gly Glu Ala Ala Ala He Phe Met Thr Ala Thr Pro 
1810 1815 1820 

Pro Gly Thr Ser Asp Pro Phe Pro Glu Ser Asn Ser Pro He Ser Asp 
825* 1830 1835 1840 

Leu Gin Thr Glu He Pro Asp Arg Ala Trp Asn Ser Gly Tyr Glu Trp 
1845 1850 1855 

He Thr Glu Tyr Thr Gly Lys Thr Val Trp Phe Val Pro Ser Val Lys 
1960 1865 1870 

Met Gly Asn Glu He Ala Leu Cys Leu Gin Arg Ala Gly Lys Lys Val 
1875 1880 1885 

Val Gin Leu Asn Arg Lys Ser Tyr Glu Thr Glu Tyr Pro Lys Cys Lys 
1890 1895 1900 

Asn Asp Asp Trp Asp Phe Val lie Thr Thr Asp He Ser Glu Met Gly 
905 1910 1915 1920 



Ala Asn Phe Lys Ala Ser Arg Val He Asp Ser Arg Lys Ser Val Lys 
1925 1930 1935 



• 
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Pro Thr lie lie Thr Glu Gly Glu Gly Arg Val lie Leu Gly Glu Pro 
1940 1945 1S50 

Ser Ala Val Thr Ala Ala Ser Ala Ala Gin Arg Arg Gly Arg lie Gly 
1955 1960 1965 

Arg Asn Pro Ser Gin Val Gly Asp Glu Tyr Cys Tyr Gly Gly His Thr 
1970 1975 1980 

Asn Glu Asp Asp Ser Asn Phe Ala His Trp Thr Glu Ala Arg lie Met 
985 1990 1995 2000 

Pro Asp Asn lie Asn Met Pro Asn Gly Leu lie Ala Gin Phe Tyr Gin 
2005 2010 2015 

Pro Glu Arg Glu Lys Val Tyr Thr Met Glu Gly Glu Tyr Arg Leu Arg 
2020 2025 2030. 

Gly Glu Glu Arg Lys Asn Phe Leu Glu Leu Leu Arg Thr Ala Asp Leu 
2035 2040 2045 

Pro Val Trp Leu Ala Tyr Lys Val Ala Ala Ala Gly Val Ser Tyr His 
2050 2055 2060- 

Asp Arg Arg Trp Cys Phe Asp Gly Pro Arg Thr Asn Thr lie Leu Glu 
065 2070 2075 2080 

Asp Asn Asn Glu Val Glu Val lie Thr Lys Leu Gly Glu Arg Lys lie 
2085 2090 2095 

Leu Arg Pro Arg Trp lie Asp Ala Arg Val Tyr Ser Asp His Gin Ala 
- • 2100 2105 21 10 

Leu Lys Ala Phe Lys Asp Phe Ala Ser Gly Lys Arg Ser Gin lie Gly 
2115 2120 2125 

Leu lie Glu Val Leu Gly Lys Met Pro Glu His Phe Met Gly Lys Thr 
2130 2135 2140 

Trp Glu Ala Leu Asp Thr Met Tyr Val Val Ala Thr Ala Glu Lys Gly 
145 2150 2155 2160 

Gly Arg Ala His Arg Met Ala Leu Glu Glu Leu Pro Asp Ala Leu Gin 
2165 2170 2175 

Thr lie Ala Leu lie Ala Leu Leu Ser Val Met Thr Met Gly Val Phe 
2180 2185 2190 

Phe Leu Leu Met Gin Arg Lys Gly lie Gly Lys lie Gly Leu Gly Gly 
2195 2200 2205 

Ala Val Leu Gly Val Ala Thr Phe Phe Cys Trp Met Ala Glu Val Pro 
2210 2215 2220 

Gly Thr Lys He Ala Gly Met Leu Leu Leu Ser Leu Leu Leu Met He 
225 2230 2235 2240 

Val Leu He Pro Glu Pro Glu Lys Gin Arg Ser Gin Thr Asp Asn Gin 
2245 2250 2255 

Leu Ala Val Phe Leu He Cys Val Met Thr Leu Val Ser Ala Val Ala 



• # 
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2260 2265 2270 

Ala Asn Glu Met Giy Trp Leu Asp Lys Thr Lys Ser Asp lie Ser Ser 
2275 2280 2285 

Leu Phe Gly Gin Arg lie Glu Val Lys Glu Asn Phe Ser Met Gly Glu 
2290 2295 2300 

Phe Leu Leu Asp Leu Arg Pro Ala Thr Ala Trp Ser Leu Tyr Ala Val 
305 2310 2315 2320 

Thr Thr Ala Val Leu Thr Pro Leu Leu Lys His Leu lie Thr Ser Asp 
2325 2330 2335 

Tyr lie Asn Thr Ser Leu Thr Ser lie Asn Val Gin Ala Ser Ala Leu 
2340 2345 2350 

Phe Thr Leu Ala Arg Gly Phe Pro Phe Val Asp Val Gly Val Ser Ala 
2355 2360 2365 

Leu Leu Leu Ala Ala Gly Cys Trp Gly Gin Val Thr Leu Thr Val Thr 
2370 2375 2380 

Val Thr Ala Ala Thr Leu Leu Phe Cys His Tyr Ala Tyr Met Val Pro 
385 2390 2395 2400 

Gly Trp Gin Ala Glu Ala Met Arg Ser Ala Gin Arg Arg Thr Ala Ala 
2405 2410 2415 

Gly He Met Lys Asn Ala Val Val Asp Gly He Val Ala Thr Asp Val 
2420 2425 2430 

Pro Glu Leu Glu Arg Thr Thr Pro He Met Gin Lys Lys Val Gly Gin 
2435 • 2440 2445 

He Met Leu He Leu Val Ser Leu Ala Ala Val Val Val Asn Pro Ser. 
2450 2455 2460 

Val Lys Thr Val Arg Glu Ala Gly He Leu He Thr Ala Ala Ala Val 
465 2470 2475 2480 

Thr Leu Trp Glu Asn Gly Ala Ser Ser Val Trp Asn Ala Thr Thr Ala 
2485 2490 2495 

lie Gly Leu Cys His He Met Arg Gly Gly Trp Leu Ser Cys Leu Ser 
2500 2505 2510 

He Thr Trp Thr Leu He Lys Asn Met Glu Lys Pro Gly Leu Lys Arg 
2515 2520 2525 

Gly Gly Ala Lys Gly Arg Thr Leu Gly Glu Val Trp Lys Glu Arg Leu 
2530 2535 2540 

Asn Gin Met Thr Lys Glu Glu Phe Thr Arg Tyr Arg Lys Glu Ala He 
545 2550 2555 2560 

He Glu Val Asp Arg Ser Ala Ala Lys His Ala Arg Lys Glu Gly Asn 
2565 2570 2575 



Val Thr Gly Gly His Ser Val Ser Arg Gly Thr Ala Lys Leu Arg Trp 
2580 2585 2590 
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Leu Val Glu Arg Arg Phe Leu Glu Pro Val Gly Lys Val lie Asp Leu 
2595 2600 2605 

Gly Cys Gly Arg Gly Gly Trp Cys Tyr Tyr Met Ala Thr Gin Lys Arg 
2610 2615 2620 

Val Gin Glu Val Arg Gly Tyr Thr Lys Gly. Gly Pro Gly His Glu Glu 
625 2630 2635 2640 

Pro Gin Leu Val Gin Ser Tyr Gly Trp Asn lie Val Thr Met Lys Ser 
2645 2650 2655 

Gly Val Asp Val Phe Tyr Arg Pro Ser Glu Cys Cys Asp Thr Leu Leu 
2660 2665 2670 

Cys Asp lie Gly Glu Ser Ser Ser Ser Ala Glu Val Glu Glu His Arg 
2675 2680 2685 

Thr lie Arg Val Leu Glu Met Val Glu Asp Trp Leu His Arg Gly Pro 
2690 2695 2700 

Arg Glu Phe Cys Val Lys Val Leu Cys Pro Tyr Met Pro Lys Val lie 
705 2710 2715 2720 

Glu Lys Met Glu Leu Leu Gin Arg Arg Tyr Gly Gly Gly Leu Val Arg 
•2725 2730 2735 

Asn Pro Leu Ser Arg Asn Ser Thr His Glu Met Tyr Trp Val Ser Arg 
2740 2745 2750 

Ala Ser Gly Asn Val Val His Ser Val Asn Met Thr Ser Gin Val Leu 
2755 2760 2765 

Leu Gly Arg Met Glu Lys Arg Thr Trp Lys Gly Pro Gin Tyr Glu Glu 
2770 2775 2780 

Asp Val Asn Leu Gly Ser Gly Thr Arg Ala Val Gly Lys Pro Leu Leu 
785 2790 2795 2800 

Asn Ser Asp Thr Ser Lys lie Asn Asn Arg lie Glu Arg Leu Arg Arg 
2805 2810 2815 

Glu Tyr Ser Ser Thr Trp His His Asp Glu Asn His Pro Tyr Arg Thr 
2820 2825 2830 

Trp Asn Tyr His Gly Ser Tyr Asp Val Lys Pro Thr Gly Ser Ala Ser 
2835 2840 2845 

Ser Leu Val Asn Gly Val Val Arg Leu Leu Ser Lys Pro Trp Asp Thr 
2850 2855 2860 

He Thr Asn Val Thr Thr Met Ala Met Thr Asp Thr Thr Pro Phe Gly 
865 2870 2875 2880 

Gin Gin Arg Val Phe Lys Glu Lys Val Asp Thr Lys Ala Pro Glu Pro 



2885 



2890 



2895 



Pro Glu Gly Ala Lys Tyr Val Leu Asn Glu Thr Thr Asn Trp Leu Trp 
2900 2905 2910 



* 
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Ala Phe Leu Ala Arg Glu Lys Arg Pro Arg Met Cys Ser Arg Glu Glu 
2915 2920 2925 

Phe lie Arg Lys Val Asn Ser Asn Ala Ala Leu Gly Ala Met Phe Glu 
2930 2935 2940 

Glu Gin Asn Gin Trp Arg Ser Ala Arg Glu Ala Val Glu Asp Pro Lys 
945 2950 2955 2960 

Phe Trp Glu Met Val Asp Glu Glu Arg Glu Ala His Leu Arg Gly Glu 
2965 2970 2975 

Cys His Thr Cys lie Tyr Asn Met Met Gly Lys Arg Glu Lys Lys Pro 
2980 2985 2990 

Gly Glu Phe Gly Lys Ala Lys Gly Ser Arg Ala lie Trp Phe Met Trp 
2995 3000 3005 

Leu Gly Ala Arg Phe Leu Glu Phe Glu Ala Leu Gly Phe Leu Asn Glu 
3010 3015 3020 

Asp His Trp Leu Gly Arg Lys Asn Ser Gly Gly Gly Val Glu Gly Leu 
025 3030 3035 3040 

Gly 'Leu Gin Lys Leu Gly Tyr lie Leu Arg Glu Val Gly Thr Arg Pro 
3045 3050 3055 

Gly Gly Lys lie Tyr Ala Asp Asp Thr Ala Gly Trp Asp Thr Arg lie 
3060 3065 3070 

Thr Arg Ala Asp Leu Glu Asn Glu Ala Lys Val Leu Glu Leu Leu Asp 
3075 3080 3085 

Gly Glu His Arg Arg Leu Ala Arg Ala lie lie Glu Leu Thr Tyr Arg 
3090 3095 3100 

His Lys Val Val Lys Val Met Arg Pro Ala Ala Asp Gly Arg Thr Val 
105 3110 3115 3120 

Met Asp Val He Ser Arg Glu Asp Gin Arg Gly Ser Gly Gin Val Val 
3125 3130 3135 

Thr Tyr Ala Leu Asn Thr Phe Thr Asn Leu Ala Val Gin Leu Val Arg 
3140 3145 3150 

Met Met Glu Gly Glu Gly Val He Gly Pro Asp Asp Val Glu Lys Leu 
3155 3160 3165 

Thr Lys Gly Lys Gly Pro Lys Val Arg Thr Trp Leu Phe Glu Asn Gly 
31.70 3175 ' 3180 

Glu Glu Arg Leu Ser Arg Met Ala Val Ser Gly Asp Asp Cys Val Val 
185 3190 3195 3200 

Lys Pro Leu Asp Asp Arg Phe Ala Thr Ser Leu His Phe Leu Asn Ala 
3205 3210 3215 

Met Ser Lys Val Arg Lys Asp He Gin Glu Trp Lys Pro Ser Thr Gly 
3220 3225 3230 



Trp Tyr Asp Trp Gin Gin Val Pro Phe Cys Ser Asn His Phe Thr Glu 
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3235 3240 3245 

Leu He Met Lys Asp Gly Arg Thr Leu Val Val Pro Cys Arg Gly Gin 
3250 3255 3260 

Asp Giu Leu Vai Gly Arg Ala Arg He Ser Pro Gly Ala Gly Trp Asn 
265 3270 3275 3280 

Val Arg Asp Thr Ala Cys Leu Ala Lys Ser Tyr Ala Gin Met Trp Leu 
3285 3290 3295 

Leu Leu Tyr Phe His Arg Arg Asp Leu Arg Leu Met Ala Asn Ala He 
3300 " 3305 3310 

Cys Ser Ala Val Pro Val Asn Trp Val Pro Thr Gly Arg Thr Thr Trp 
3315 3320 3325 

Ser He His Ala Gly Gly Glu Trp Met Thr Thr Glu Asp Met Leu Glu 
3330 3335 3340 

Val Trp Asn Arg Val Trp He Glu Glu Asn Glu Trp Met Glu Asp Lys 
345 3350 3355 3360 

Thr Pro Val Glu Lys Trp Ser Asp Val Pro Tyr Ser Gly Lys Arg Glu 
3365 3370 3375 

Asp He Trp Cys Gly Ser Leu He Gly Thr Arg Ala Arg Ala Thr Trp 
3380 ~ 3385 3390 

Ala Glu Asn He Gin Val Ala lie Asn Gin Val Arg Ala He He Gly 
3395 3400 3405 

Asp Glu Lys Tyr Val Asp Tyr Met Ser Ser Leu Lys Arg Tyr Glu Asp 
3410 3415 3420 

Thr Thr Leu Val Glu Asp Thr Val Leu 
425 3430 



<210> 3 

<211> 37 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de ia sequence artificielle : AMORCE 
OLIGONUCLEOTIDIQUE 

<400> 3 

tagcacgaag aattcgatgt ctaagaaacc aggaggg 37 



<210> 4 

<211> 50 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : AMORCE 
OLIGONUCLEOTIDIQUE 
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<400> 4 

aagttagccc gggttaatgc tcctacgctg gcgatcaggc caatcaggac 



50 



<210> 5 

<211> 19 

<212> ADN 

<213> Sequence artificielle 



<220> 



<223> Description de la sequence artificielle : amorce 



<400> 5 

gtcagacgct gacctggtg 



19 



<210> 6 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 
<400> 6 

agcttctcct tacacagttg g 21 



<210> 7 
<211> 19 
<21 2> ADN 

< 2 1 3 > Sequence artificielle 

<223> Description de la sequence artificielle : amorce 



<400> 7 

acagtgcagg tgtgtgagc 



19 



<210> 8 
<211> 20 
<212> ADN 

<21 3>* Sequence artificielle 



< 

<223> Description de la sequence artificielle : amorce 



<400> 8 

tcatgtctca gaaaggaaac 



20 



<210> 9 
<21 1 > 21 
<212> ADN 

< 2 1 3 > Sequence artificielle 



<220> 

<223> Description de la sequence artificielle: amorce 
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<400> 9 

ctggctgcag aggtaaaagc t 



21 



<210> 10 
<211> 22 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 
<400> 10 

tcaggacagg gtggagtaga gc 22 

<210> 11 

<211> 22 

<212> ADN 

<213> Sequence artificielle 



<210> 12 
<211> 22 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 
<400> 12 

gctccatcca tccaaccatc ca 22 

<210> 13 
<211> 21 
<21 2> ADN 

< 2 1 3 > Sequence artificielle 

<220> 

<223> Description de la sequence artificielle : amorce 
<400> 13 

gagtttgaag tgaggtgttg c 21 



<210> 14 
<21 1 > 21 
<21 2> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 



<220> 



<223> Description de la sequence artificielle : amorce 



<400> 11 

gtaccggacc ctcacccctt gt 



22 



<400> 14 
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ttctcttgtg gatgcgttgt g 



<210> 15 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la- sequence artificielle: amorce 
<400> 15 

tgggtatatg cggagcgatg c 



<210> 16 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: amorce 
<400> 16 

agtcgaacca acccgctgtc a 

<210> 17 

<211> 21 

<21 2> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 

<400> 17 

actacctcac acggaatcta c 

<210> 18 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle:amorce 
<400> 18 

ttctacgcca atctcatcag t 

<210> 19 

<211> 21 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artif icielle: amorce 



<400> 19 
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acacagtgtc catctcaacc a 



<210> 20 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 
<400> 20 

aaccactggt caaggttctg c 



<210> 21 

<211> 23 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 

<400> 21 

'acaaccacgt ccataagtct ctg 



<210> 22 
<211> 21 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : amorce 
<400> 22 

gcctttctct tctcagtgta a 



<210> 23 
<211> 1412 
<212> ADN 

<213> Mus musculus 

<220> 

<221 > CDS 

<222> (36). .{1139) 

<400> 23 

ccaggctggg agacccagga agctccagac ttagc atg gag cac gga etc agg 

Met Glu His Gly Leu Arg 
1 5 

age ate cca gec tgg acg ctg gac aag ttc ata gag gat tac etc ctt 
Ser lie Pro Ala Trp Thr Leu Asp Lys Phe lie Glu Asp Tyr Leu Leu 
10 15 20 



ccc gac acc acc ttt ggt get gat gtc aaa tea gee gtc aat gtc gtg 
Pro Asp Thr Thr Phe Gly Ala Asp Val Lys Ser Ala Val Asn Val Val 
25 30 35 
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tgt gat ttc ctg aag gag aga tgc ttc caa ggt get gec cac cca gtg 
Cys Asp Phe Leu Lys Glu Arg Cys Phe Gin Gly Ala Ala His Pro Val 
40 4 5 50 

agg gtc tec aag gtg gtg aag ggt ggc tec tea ggc aaa ggc acc aca 
Arg Val Ser Lys Val Val Lys Gly Gly Ser Ser Gly Lys Gly Thr Thr 
55 60 65 70 

etc aag ggc agg tea gac get gac ctg gtg gtg ttc ctt aac aat etc 
Leu Lys Gly Arg Ser Asp Ala Asp Leu Val Val Phe Leu Asn Asn Leu 
75 80 85 

acc age ttt gag gat cag tta aac cga egg gga gag ttc ate aag gaa 
Thr Ser Phe Glu Asp Gin Leu Asn Arg Arg Gly Glu Phe lie Lys Glu 
90 95 100 

att aag aaa cag ctg tac gag gtt cag cat gag aga cgt ttt aga gtc 
lie Lys Lys Gin Leu Tyr Glu Val Gin His Glu Arg Arg Phe Arg Val 
105 110 115 

aag ttt gag gtc cag agt tea tgg tgg ccc aac gee egg tct ctg age 
Lys Phe Glu Val Gin Ser Ser Trp Trp Pro Asn Ala Arg Ser Leu Ser 
120 125 130 

ttc aag ctg age gee ccc cat ctg cat cag gag gtg gag ttt gat gtg 
Phe Lys Leu Ser Ala Pro His Leu His Gin Glu Val Glu Phe Asp Val 
135 140 145 150 

ctg cca gec ttt gat gtc ctg ggt cat gtt aat act tec age aag cct 
Leu Pro Ala Phe Asp Val Leu Gly His Val Asn Thr Ser Ser Lys Pro 
155 160 165 

gat ccc aga ate tat gee ate etc ate gag gaa tgt acc tec ctg ggg 
Asp Pro Arg lie Tyr Ala lie Leu lie Glu Glu Cys Thr Ser Leu Gly 
170 175 180 

aag gat ggc gag ttc tct acc tgc ttc' acg gag etc cag egg aac ttc 
Lys Asp Gly Glu Phe Ser Thr Cys Phe Thr Glu Leu Gin Arg Asn Phe 
185 190 195 

ctg aag cag cgc cca acc aag ctg aag agt etc ate cgc ctg gtc aag 
Leu Lys Gin Arg Pro Thr Lys Leu Lys Ser Leu lie Arg Leu Val Lys 
200 205 210 

cac tgg tac caa ctg tgt aag gag aag ctg ggg aag cca ttg cct cca 
His Trp Tyr Gin Leu Cys Lys Glu Lys Leu Gly Lys Pro Leu Pro Pro 
215 220 225 230 

cag tac gee eta gag ttg etc act gtc ttt gec tgg gaa caa ggg aat 
Gin Tyr Ala Leu Glu Leu Leu Thr Val Phe Ala Trp Glu Gin Gly Asn 
235 240 245 

gga tgt tat gag ttc aac aca gec cag ggc ttc egg acc gtc ttg gaa 
Gly Cys Tyr Glu Phe Asn Thr Ala Gin Gly Phe Arg Thr Val Leu Glu 
250 255 ~ 260 

ctg gtc ate aat tat cag cat ctt cga ate tac tgg aca aag tat tat 
Leu Val lie Asn Tyr Gin His Leu Arg lie Tyr Trp Thr Lys Tyr Tyr 
265 270 275 



gac ttt caa cac cag gag gtc tec aaa tac ctg cac aga cag etc aga 



# 




32 2823224 

Asp Phe Gin His Gin Glu Val Ser Lys Tyr Leu His Arg Gin Leu Arg 
280 285 290 

aaa gcc agg cct gtg ate ctg gac cca get gac cca aca ggg aat gtg 965 
Lys Ala Arg Pro Val lie Leu Asp Pro Ala Asp Pro Thr Gly Asn Val 
295 300 305 310 

gcc ggt ggg aac cca gag ggc tgg agg egg ttg get gaa gag get gat 1013 
Ala Gly Gly Asn Pro Glu Gly Trp Arg Arg Leu Ala Glu Glu Ala Asp 
315 320 325 

gtg tgg eta tgg tac cca tgt ttt att aaa aag gat ggt tec cga gtg 1061 
Val Trp Leu Trp Tyr Pro Cys Phe lie Lys Lys Asp Gly Ser Arg Val 
330 335 340 

age tec tgg gat gtg ccg acg gtg gtt cct gta cct ttt gag cag gta 1109- 
Ser Ser Trp Asp Val Pro Thr Val Val Pro Val Pro Phe Glu Gin Val 
345 350 355 

gaa gag aac tgg aca tgt ate ctg ctg tga gcacagcagc acctgcccag 1159 
Glu Glu Asn Trp Thr Cys lie Leu Leu 
360 365 

gagactgetg gtcaggggca tttgetgetc tgetgeagge ccatgaccca gtgagggagg 1219 

gccccacctg gcatcagact ccgtgcttct gatgcctgcc agccatgttt gactcctgtc 1279 

caatcacagc cagccttcct caacagattc agaaggagag gaaagaacac acgcttggtg 1339 

tccatctgtc cacctgttgg aaggttctgt ctgacaaagt ctgatcaaca ataaaccaca 1399 

gcaggtgccg tea 1412 



<210> 24 
<211> 367 
<212> PRT 

<213> Mus musculus 
<400> 24 

Met Glu His Gly Leu Arg Ser lie Pro Ala Trp Thr Leu Asp Lys Phe 
15 10 15 

He Glu Asp Tyr Leu Leu Pro Asp Thr Thr Phe Gly Ala Asp Val Lys 
20 25 30 

Ser Ala Val Asn Val Val Cys Asp Phe Leu Lys Glu Arg Cys Phe Gin 
35 40 45 

Gly Ala Ala His Pro Val Arg Val Ser Lys Val Val Lys Gly Gly Ser 
50 55 60 

Ser Gly Lys Gly Thr Thr Leu Lys Gly Arg Ser Asp Ala Asp Leu Val 
65 70 75 80 

Val Phe Leu Asn Asn Leu Thr Ser Phe Glu Asp Gin Leu Asn Arg Arg 
85 90 95 



Gly Glu Phe He Lys Glu He Lys Lys Gin Leu Tyr Glu Val Gin His 
100 105 110 



# 
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Glu Arg Arg Phe Arg Val Lys Phe Glu Val Gin Ser Ser Trp Trp Pro 
115 120 125 

Asn Ala Arg Ser Leu Ser Phe Lys Leu Ser Ala Pro His Leu His Gin 
130 135 140 

Glu Val Glu Phe Asp Val Leu Pro Ala Phe Asp Val Leu Gly His Val 
145 150 155 160- 

Asn Thr Ser Ser Lys Pro Asp Pro Arg lie Tyr Ala lie Leu lie Glu 
165 170 175 

Glu Cys Thr Ser Leu Gly Lys Asp Gly Glu Phe Ser Thr Cys Phe Thr 
180 185 190 

Glu Leu Gin Arg Asn Phe Leu Lys Gin Arg Pro Thr Lys Leu Lys Ser 
195 200 205 

Leu lie Arg Leu Val Lys His Trp Tyr Gin Leu Cys Lys Glu Lys Leu 
210 215 220 

Gly Lys Pro Leu Pro Pro Gin Tyr Ala Leu Glu Leu Leu Thr Val Phe 
225 230 235 240 

Ala Trp Glu Gin Gly Asn Gly Cys Tyr Glu Phe Asn Thr Ala Gin Gly 
245 250 255 

Phe Arg Thr Val Leu Glu Leu Val lie Asn Tyr Gin His Leu Arg lie 
260 265 270 

Tyr Trp Thr Lys Tyr Tyr Asp Phe Gin His Gin Glu Val Ser Lys Tyr 
275 280 285 

Leu His Arg Gin Leu Arg Lys Ala Arg Pro Val lie Leu Asp Pro Ala 
290 295 300 

Asp Pro Thr Gly Asn Val Ala Gly Gly Asn Pro Glu Gly Trp Arg Arg 
305 310 315 ' 320 

Leu Ala Glu Glu Ala Asp Val Trp Leu Trp Tyr Pro Cys Phe lie Lys 
325 330 335 

Lys Asp Gly Ser Arg Val Ser Ser Trp Asp Val Pro Thr Val Val Pro 
340 345 350 

Val Pro Phe Glu Gin Val Glu Glu Asn Trp Thr Cys lie Leu Leu 
355 360 365 



<210> 25 

<211> 1413 

<212> ADN 

<213> Mus musculus 

<220> 

<221> CDS 

<222> (36). .(1139) 



<400> 25 



• 
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ccaggctggg agacccagga agctccagac ttagc atg gag cac gga etc agg 53 

Met Glu His Gly Leu Arg 
1 5 

age ate cca gec tgg acg ctg gac aag ttc ata gag gat tac etc ctt 101 
Ser lie Pro Ala Trp Thr Leu Asp Lys Phe He Glu Asp Tyr Leu Leu 
10 15 20 

ccc gac acc acc ttt ggt get gat gtc aaa tea gee gtc aat gtc gtg 149 
Pro Asp Thr Thr Phe Gly Ala Asp Val Lys Ser Ala Val Asn Val Val 
25 30 35 

tgt gat ttc ctg aag gag aga tgc ttc caa ggt get gee cac cca gtg 197 
Cys Asp Phe Leu Lys Glu Arg Cys Phe Gin Gly Ala Ala His Pro Val 
40 45 50 

agg gtc tec aag gtg gtg aag ggt ggc tec tea ggc aaa ggc acc aca 245 
Arg Val Ser Lys Val Val Lys Gly Gly Ser Ser Gly Lys Gly Thr Thr 
55 60 65 70 

etc aag ggc agg tea gac get gac ctg gtg gtg ttc ctt aac aat etc 293 
Leu Lys Gly Arg Ser Asp Ala Asp Leu Val Val Phe Leu Asn Asn Leu 
'75 80 85 

acc age ttt gag gat cag tta aac cga egg gga gag ttc ate aag gaa 341 
Thr Ser Phe Glu Asp Gin Leu Asn Arg Arg Gly Glu Phe He Lys Glu 
90 95 100 

att aag aaa cag ctg tac gag gtt cag cat gag aga cgt ttt aga gtc 389 
He Lys Lys Gin Leu Tyr Glu Val Gin His Glu Arg Arg Phe Arg Val 
105 110 115 

aag ttt gag gtc cag agt tea tgg tgg ccc aac gee egg tct ctg age 437 
Lys Phe Glu Val Gin Ser Ser Trp Trp Pro Asn Ala Arg Ser Leu Ser 
120 125 130 

ttc aag ctg age gee ccc cat ctg cat cag gag gtg gag ttt gat gtg 485 
Phe Lys Leu Ser Ala Pro His Leu His Gin Glu Val Glu Phe Asp Val 
135 140 145 " 150 

ctg cca gec ttt gat gtc ctg ggt cat gtt aat act tec age aag cct 533 
Leu Pro Ala Phe Asp Val Leu Gly His Val Asn Thr Ser Ser Lys Pro 
155 160 165 

gat ccc aga ate tat gee ate etc ate gag gaa tgt acc tec ctg ggg 581 
Asp Pro Arg He Tyr Ala He Leu He Glu Glu Cys Thr Ser Leu Gly 
170 175 180 

aag gat ggc gag ttc tct acc tgc ttc acg gag etc cag egg aac ttc 629 
Lys Asp Gly Glu Phe Ser- Thr Cys Phe Thr Glu Leu Gin Arg Asn Phe 
185 190. 195 

ctg aag cag cgc cca acc aag ctg aag agt etc ate cgc ctg gtc aag 677 
Leu Lys Gin Arg Pro Thr Lys Leu Lys Ser Leu He Arg Leu Val Lys 
200 205 210 

cac tgg tac caa ctg tgt aag gag aag ctg ggg aag cca ttg cct cca 725 
His Trp Tyr Gin Leu Cys Lys Glu Lys Leu Gly Lys Pro Leu Pro Pro 
215 220 225 230 

cag tac gec eta gag ttg etc act gtc ttt gee tgg gaa caa ggg aat 773 
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Gin Tyr Ala Leu Glu Leu Leu Thr Val Phe Ala TrD Glu Gin Gly Asn 
235 240 245 

gga tgt tat gag ttc aac aca gcc cag ggc ttc egg acc gtc ttg gaa 821 
Gly Cys Tyr Glu Phe Asn Thr Ala Gin Gly Phe Arg Thr Val Leu Glu 
250 255 260 

ctg gtc ate aat tat cag cat ctt cga ate tac tgg aca aag tat tat 869 
Leu Val lie Asn Tyr Gin His Leu Arg lie Tyr Trp Thr Lys Tyr Tyr 
265 270 275 

gac ttt caa cac cag gag gtc tec aaa tac ctg cac aga cag etc aga 917 
Asp Phe Gin His Gin Glu Val Ser Lys Tyr Leu His Arg Gin Leu Arg 
280 285 290 

aaa gcc agg cct gtg ate ctg gac cca get gac cca aca ggg aat gtg 965 
Lys Ala Arg Pro Val lie Leu Asp Pro Ala Asp Pro Thr Gly Asn Val 
295 300 305 310 

gcc ggt ggg aac cca gag ggc tgg agg egg ttg get gaa gag get gat 1013 
Ala Gly Gly Asn Pro Glu Gly Trp Arg Arg Leu Ala Glu Glu Ala Asp 
315 320 325 

gtg tgg eta tgg tac cca tgt ttt att aaa aag gat ggt tec cga gtg 1061 
Val Trp Leu Trp Tyr Pro Cys Phe He Lys Lys Asp Gly Ser Arg Val 
330 335 340 

age tec tgg gat gtg ccg acg gtg gtt cct gta cct ttt gag cag gta 1109 
Ser Ser Trp Asp Val Pro Thr Val Val Pro Val Pro Phe Glu Gin Val 
345 350 355 

gaa gag aac tgg aca tgt ate ctg ctg tga gcacagcagc acctgcccag 1159 
Glu Glu Asn Trp Thr Cys He Leu Leu 
360 365 

gagactgetg gtcaggggca tttgetgetc tgetgeagge ccatgaccca gtgagggagg 1219 

gccccacctg gcatcagact ccgtgcttct gatgcctgcc agccatgttt gactcctgtc 1279 

caatcacagc cagccttcct caacagattc agaaggagag gaaagaacac acgcttggtg 1339 

tccatctgtc cacctgttgg aaggttctgt ctgacaaagt ctgatcaaca ataaaccaca 1399 

gcaggtgccc gtca 1413 



<210> 26 

<211> 367 

<212> PRT 

<213> Mus musculus 



<400> 26 
Met Glu His Gly 
1 

He Glu Asp Tyr 
20 

Ser Ala Val Asn 
35 



Leu Arg Ser He 
5 

Leu Leu Pro Asp 

Val Val Cys Asp 
40 



Pro Ala Trp Thr 
10 

Thr Thr Phe Gly 
25 

Phe Leu Lys Glu 



Leu Asp Lys Phe 
1 5 

Ala Asp Val Lys 
30 

Arg Cys Phe Gin 
45 



# 



* 
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Gly Ala Ala His Pro Val Arg Val Ser Lys Val Val Lys Gly Gly Ser 
50 55 * 60 

Ser Gly Lys Gly Thr Thr Leu Lys Gly Arg Ser Asp Ala Asp Leu Val 
65 70 75 80 

• Val Phe Leu Asn Asn Leu Thr Ser Phe Glu Asp Gin Leu Asn Arg Arg 
85 90 95 

Gly Glu Phe lie Lys Glu lie Lys Lys Gin Leu Tyr Glu Val Gin His 
100 105 * 110 

Glu Arg Arg Phe Arg Val Lys Phe Glu Val Gin Ser Ser Trp Trp Pro 
115 120 125 

Asn Ala Arg Ser Leu Ser Phe Lys Leu Ser Ala Pro His Leu His Gin 
130 135 140 

Glu Val Glu Phe Asp Val Leu Pro Ala Phe Asp Val Leu Gly His Val 
145 150 155 160 

Asn Thr Ser Ser Lys Pro Asp Pro Arg He Tyr Ala He Leu He Glu 
165 170 175 

Glu Cys Thr Ser Leu Gly Lys Asp Gly Glu Phe Ser Thr Cys Phe Thr 
180 * 185 190 

Glu Leu Gin Arg Asn Phe Leu Lys Gin Arg Pro Thr Lys Leu Lys Ser 
195 200 205 

Leu He Arg Leu Val Lys His Trp Tyr Gin Leu Cys Lys Glu Lys Leu 
210 215 220 

Gly Lys Pro Leu Pro Pro Gin Tyr Ala Leu Glu Leu Leu Thr Val Phe 
225 230 235 240 

Ala Trp Glu Gin Gly Asn Gly Cys Tyr Glu Phe Asn Thr Ala Gin Gly 
245 250 255 

Phe Arg Thr Val Leu Glu Leu Val He Asn Tyr Gin His Leu Arg He 
260 265 270 

Tyr Trp Thr Lys Tyr Tyr Asp Phe Gin His Gin Glu Val Ser Lys Tyr 
275 280 285 

Leu His Arg Gin Leu Arg Lys Ala Arg Pro Val He Leu Asp Pro Ala 
290 295 300 

Asp Pro Thr Gly Asn Val Ala Gly Gly Asn Pro Glu Gly Trp Arg Arg 
305 310 315 * 320 

Leu Ala Glu Glu Ala Asp Val Trp Leu Trp Tyr Pro Cys Phe He Lys 
325 330 ~ 335 

Lys Asp Gly Ser Arg Val Ser Ser Trp Asp Val Pro Thr Val Val Pro 
340 345 350 

Val Pro Phe Glu Gin Val Glu Glu Asn Trp Thr Cys He Leu Leu 
355 360 365 
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<210> 27 

<211> 902 

<212> ADN 

<213> Mus musculus 

<220> 

<221> CDS 

<222> (36) . . (791) 

<400> 27 

acctgctggc tgcagaggta aaagctggac ctagg atg gag cag gat ctg agg 53 

Met Glu Gin Asp Leu Arg 
1 5 

age ate ccg gee teg aag ctt gat aag ttc ata gag aac cat etc ccg 101 
Ser lie Pro Ala Ser Lys Leu Asp Lys Phe He Glu Asn His Leu Pro 
10 15 20 

gac acc age ttc tgt get gac etc aga gaa gtc ata gat gec ctg tgt 149 
Asp Thr Ser .Phe Cys Ala Asp Leu Arg Glu Val lie Asp Ala Leu Cys 
25 -30 35 

get etc ctg aag gac aga tec ttc egg ggc ccc gtc cgc cga atg agg 197 
Ala Leu Leu Lys Asp Arg Ser Phe Arg Gly Pro Val Arg Arg Met Arg 
40 45 50 

gec tct aaa ggg gtc aag ggc aaa ggc acc gcg etc aag ggc agg tea 24 5 
Ale Ser Lys Gly Val Lys Gly Lys Gly Thr Ala Leu Lys Gly Arg Ser 
55 60 . 65 70 

gac get gac ctg gtg gtg ttc ctt aac aat etc acc age ttt gag gat 293 
Asp Ala Asp Leu Val Val Phe Leu Asn Asn Leu Thr Ser Phe Glu Asp 
75 80 85 

cag tta aac caa cag gga gtg ttg att aag gaa att aag aaa cag ctg 341 
Gin Leu Asn Gin Gin Gly Val Leu He Lys Glu He Lys Lys Gin Leu 
90 95 100 

tgc gag gtt cag cat gag aga cgt tgt gga gtg aag ttt gag gtc cac 389 
Cys Glu Val Gin His Glu Arg Arg Cys Gly Val Lys Phe Glu Val His 
105 no 115 

agt tta agg agt ccc aac tec egg get ctg age ttc aag ctg age gec 437 
Ser Leu Arg Ser Pro Asn Ser Arg Ala Leu Ser Phe Lys Leu Ser Ala 
120 125 130 



ccc gac ctg ctg aag gag gtg aag ttt gat gtg ctg cca gec tat gat 
Pro Asp Leu Leu Lys Glu Val Lys Phe Asp Val Leu Pro Ala Tyr Asp 
135 140 145 



150 



485 



tta ctg gat cat ctt aac ate etc aag aag cct aac caa caa ttc tac 533 
Leu Leu Asp His Leu Asn He Leu Lys Lys Fro Asn Gin Gin Phe Tyr 
155 160 165 

gec aat etc ate agt ggc gta ccc gec ggg aag gag ggc aag tta teg 581 
Ala Asn Leu He Ser Gly Val Pro Ala Gly Lys Glu Gly Lys Leu Ser 
170 175 180 

ate tgc ttt atg ggg ctt cag aag tac ttc ctg aac tgt cgc cca acc 629 
He Cys Phe Met Gly Leu Gin Lys Tyr Phe Leu Asn Cys Arg Pro Thr 
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185 190 195 

aag ctg aag cgc etc ate cgc ctg gtc acg cac tgg tac caa ctg tgt 677 
Lys Leu Lys Arg Leu He Arg Leu Val Thr His Trp Tyr Gin Leu Cys 
200 205 210 

aag gag aag ctg ggg gac ccg ctg ccc cca cag tat gec ctg gag ctg 725 
Lys Glu Lys Leu Gly Asp Pro Leu Pro Pro Gin Tyr Ala Leu Glu Leu 
215 220 225 230 

etc aca etc gat gee tgg gag tat ggg agt cga gta act aaa ttc aac 773 
Leu Thr Leu Asp Ala Trp Glu Tyr Gly Ser Arg Val Thr Lys Phe Asn 
235 240 245 

aca gee cag ggc ttc tga acegtcttgg aactggtcac caagtacaaa 821 
Thr Ala Gin Gly Phe 
250 

cagcttcaaa tctactggac" agtgtattat gactttcaac accaggaggt ctccaaatac 881 
ctgcacagac agctcagaaa a 90 2 



<210> 28 
<211> 251 
<212> PRT 

<213> Mus musculus 
<400> 28 

Met Glu Gin Asp Leu Arg Ser He Pro Ala Ser Lys Leu Asp Lys Phe 
1 5 10 15 

He Glu Asn His Leu Pro Asp Thr Ser Phe Cys Ala Asp Leu Arg Glu 
20 25 30 

Val He Asp Ala Leu Cys Ala Leu Leu Lys Asp Arg Ser Phe Arg Gly 
35 40 45 

Pro Val Arg Arg Met Arg Ala Ser Lys Gly Val Lys Gly Lys Gly Thr 
50 55 60 

Ala Leu Lys Gly Arg Ser Asp Ala Asp Leu Val Val Phe Leu Asn Asn 
65 70 75 80 

Leu Thr Ser Phe Glu Asp Gin Leu Asn Gin Gin Gly Val Leu lie Lys 
85 90 95 

Glu He Lys Lys Gin Leu Cys Glu Val Gin His Glu Arg Arg Cys Gly 
1 00 105 no 

Val Lys Phe Glu Val His Ser Leu Arg Ser Pro Asn Ser Arg Ala Leu 
115 120 125 

Ser Phe Lys Leu Ser Ala Pro Asp Leu Leu Lys Glu Val Lys Phe Asp 
130 135 140 

Val Leu Pro Ala Tyr Asp Leu Leu Asp His Leu Asn He Leu Lys Lys 
145 150 155 160 

Pro Asn Gin Gin Phe Tyr Ala Asn Leu He Ser Gly Val Pro Ala Gly 
165 170 175 
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Lys Glu Gly Lys Leu Ser lie Cys Phe Met Gly Leu Gin Lys Tyr Phe 
180 185 190 

Leu Asn Cys Arg Pro Thr Lys Leu Lys Arg Leu He Arg Leu Val Thr 
195 200 205 

His Trp Tyr Gin Leu Cys Lys Glu Lys Leu Gly Asp Pro Leu Pro Pro 
210 215 220 

Gin Tyr Ala Leu Glu Leu Leu Thr Leu Asp Ala Tro Glu Tyr Gly Ser 
225 230 235 * 240 

Arg Val Thr Lys Phe Asn Thr Ala Gin Gly Phe 
245 250 



<210> 29 

<211> 1322 

<212> ADN • 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (34) . . (1128) 

<400> 29 

gaggcagttc tgttgccact ctctctcctg tea atg atg gat etc aga aat ace 54 

Met Met Asp Leu Arg Asn Thr 
1 5 

cca gec aaa tct ctg gac aag ttc att gaa gac tat etc ttg cca gac 102 
Pro Ala Lys Ser Leu Asp Lys Phe He Glu Asp Tyr Leu Leu Pro Asp 
10 15 20 

acg tgt ttc cgc atg caa ate aac cat gec att gac ate ate tgt ggg 1 50 
Thr Cys Phe Arg Met Gin He Asn His Ala He Asp He He Cys Gly 
25 30 35 

ttc ctg aag gaa agg tgc ttc cga ggt age tec tac cct gtg tgt gtg 198 
Phe Leu Lys Glu Arg Cys Phe Arg Gly Ser Ser Tyr Pro Val Cys Val 
40 . 45 50 55 

tec aag gtg gta aag ggt ggc tec tea ggc aag ggc acc acc etc aga 246 
Ser Lys Val Val Lys Gly Gly Ser Ser Gly Lys Gly Thr Thr Leu Arg 
60 65 70 

ggc cga tct gac get gac ctg gtt gtc ttc etc agt cct etc acc act 294 
Gly Arg Ser Asp Ala Asp Leu Val Val Phe Leu Ser Pro Leu Thr Thr 
75 80 85 

ttt cag gat cag tta aat cgc egg gga gag ttc ate cag gaa att agg 342 
Phe Gin Asp Gin Leu Asn Arg Arg Gly Glu Phe lie Gin Glu He Arg 
90 95 100 

aga cag ctg gaa gee tgt caa aga gag aga gca ttt tec gtg aag Ltt 390 
Arg Gin Leu Glu Ala Cys Gin Arg Glu Arg Ala Phe Ser Val Lys Phe 
105 110 115 

I 

gag gtc cag get cca cgc tgg ggc aac ccc tgt gcg etc age ttc gta 438 
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Glu Val Gin Ala Pro Arg Trp Gly Asn Pro Arg Ala Leu Ser Phe Val 
120 125 130 135 

ctg agt teg etc cag etc ggg gag ggg gtg gag ttc gat gtg ctg cct 486 
Leu Ser Ser Leu Gin Leu Gly Glu Gly Val Glu Phe Asp Val Leu Pro 
140 145 150 

gee ttt gat gee ctg ggt cag ttg act ggc age tat aaa cct aac ccc 534 
Ala Phe Asp Ala Leu Gly Gin Leu Thr Gly Ser Tyr Lys Pro Asn Pro 
155 160 * 165 

caa ate tat gtc aag etc ate gag gag tgc acc gac ctg cag aaa gag 582 
Gin He Tyr Val Lys Leu He Glu Glu Cys Thr Asp Leu Gin Lys Glu 
170 175 180 

ggc gag ttc tec acc tgc ttc aca gaa eta cag aga gac ttc ctg aag 630 
Gly Glu Phe Ser Thr Cys Phe Thr Glu Leu Gin Arg Asp Phe Leu Lys 
185 190 195 

cag cgc ccc acc aag etc aag age etc atc.cgc eta gtc aag cac tgg 678 
Gin Arg Pro Thr Lys Leu Lys Ser Leu He Arg Leu Val Lys His Trp 
200 205 21 0 J 215 

tac caa aat tgt aag aag aag ctt ggg aag ctg cca cct cag tat gee 726 
Tyr Gin Asn Cys Lys Lys Lys Leu Gly Lys Leu Pro Pro Gin Tyr Ala 
220 225 230 

ctg gag etc ctg acg gtc tat get tgg gag cga ggg age atg aaa aca 774 
Leu Glu Leu Leu Thr Val Tyr Ala Trp Glu Arg Gly Ser Met Lys Thr 
235 240 245 

cat ttc aac aca gec cag gga ttt egg acg gtc ttg gaa tta gtc ata 822 
His Phe Asn Thr Ala Gin Gly Phe Arg Thr Val Leu Glu Leu Val He 
250 255 260 

aac tac cag caa etc tgc ate tac tgg aca aag tat tat gac ttt aaa 870 
Asn Tyr Gin Gin Leu Cys He Tyr Trp Thr Lys Tyr Tyr Asp ^>he Lys 
265 270 275 

aac ccc att att gaa aag tac ctg aga agg cag etc acg aaa ccc acg 918 
Asn Pro He He Glu Lys Tyr Leu Arg Arg Gin Leu Thr Lys Pro Thr 
280 285 290 ' 295 

cct gtg ate ctg gac ccg gcg gac cct aca gga aac ttg ggt ggt gga 966 
Pro Val He Leu Asp Pro Ala Asp Pro Thr Gly Asn Leu Gly Gly Gly 
300 305 310 

gac cca aag cgt tgg agg cag ctg gca caa gag get gag gee tgg ctg 1014 
Asp Pro Lys Arg Trp Arg Gin Leu Ala Gin Glu Ala Glu Ala Trp Leu 
315 320 325 

aat tac cca tgc ttt aag aat tgg gat ggg tec cca gtg age tec tgg 1062 
Asn Tyr Pro Cys Phe Lys Asn Trp Asp Gly Ser Pro Val Ser Ser Trp 
330 335 340 

att ctg ctg gtg aga cct cct get tec tec ctg cca ttc ate cct gec 1110 
He Leu Leu Val Arg Pro Pro Ala Ser Ser Leu Pro Phe He Pro Ala 
345 350 355 

cct etc cat gaa get tga gacatatagc tggagaccat tctttccaaa 1158 
Pro Leu His Glu Ala 





41 
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360 



365 



gaacttacct cttgccaaag gccatttata ttcatatagt gacaggctgt gctccatatt 1218 
ttacagtcat tttggtcaca atcgagggtt tctggaattt tcacatccct tgtccagaat 1278 
tcattcccct aagagtaata ataaataatc tctaacacca aaaa 1322 



<210> 30 
<211> 364 
<212> PRT 

< 2 1 3 > Homo sapiens 
<400> 30 

Met Met Asp Leu Arg Asn Thr Pro Ala Lys Ser Leu Asp Lys Phe He 
1 5 10 15 

Glu Asp Tyr Leu Leu Pro Asp Thr Cys Phe Arg Met Gin He Asn His 
20 25 30 

Ala He Asp He He Cys Gly Phe Leu Lys Glu Ara Cys Phe Arg Gly 
35 40 45 

Ser Ser Tyr Pro Val Cys Val Ser Lys Val Val Lys Gly Gly Ser Ser 
50 55 60 

Gly Lys Gly Thr Thr Leu Arg Gly Arg Ser Asp Ala Asp Leu Val Val 
65 70 75 ■ 80 

Phe Leu Ser Pro Leu Thr Thr Phe Gin Asp Gin Leu Asn Arg Arg Gly 
85 90 95 

Glu Phe He Gin Glu He Arg Arg Gin Leu Glu Ala Cys Gin Arg Glu 
100 105 * 110 

Arg Ala Phe Ser Val Lys Phe Glu Val Gin Ala Pro Arg Trp Gly Asn 
115 120 125 

Pro Arg Ala Leu Ser Phe Val Leu Ser Ser Leu Gin Leu Gly Glu Gly 
130 135 140 

Val Glu Phe Asp Val Leu Pro Ala Phe Asp Ala Leu Gly Gin Leu Thr 
145 150 155 ' 160 

Gly Ser Tyr Lys Pro Asn Pro Gin He Tyr Val Lys Leu He Glu Glu 
165 170 175 

Cys Thr Asp Leu Gin Lys Glu Gly Glu Phe Ser Thr Cys Phe Thr Glu 
180 185 ~ 190 

Leu Gin Arg Asp Phe Leu Lys Gin Arg Pro Thr Lys Leu Lys Ser Leu 
195 200 * 205 

He Arg Leu Val Lys His Trp Tyr Gin Asn Cys Lys Lys Lys Leu Gly 
210 215 220 

Lys Leu Pro Pro Gin Tyr Ala Leu Glu Leu Leu Thr Val Tyr Ala Trp 
225 230 235 ' 240 

Glu Arg Gly Ser Met Lys Thr His Phe Asn Thr Ala Gin Gly Phe Arg 
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245 



250 



255 



Thr Val Leu Glu Leu Val He Asn Tyr Gin Gin Leu Cys He Tyr Trp 
260 265 270 

Thr Lys Tyr Tyr Asp Phe Lys Asn Pro He He Glu Lys Tyr Leu Arg 
275 280 285 

Arg Gin Leu Thr Lys Pro Thr Pro Val He Leu Asp Pro Ala Asp Pro 
290 295 300 

■Thr Gly Asn Leu Gly Gly Gly Asp Pro Lys Arg Trp Arg Gin Leu Ala 
305 31 0 31 5 320 

Gin Glu Ala Glu Ala Trp Leu Asn Tyr Pro Cys Phe Lys Asn Trp Asp 
325 330 335 

Gly Ser Pro Val Ser Ser Trp He Leu Leu Val Arg Pro Pro Ala Ser 
340 345 350 

Ser Leu Pro Phe lie Pro Ala Pro Leu His Glu Ala 
355 360 



<210> 31 

<211> 450 

<212> ADN 

<213> Sequence artificielle 



<220> 

<223> Description de la 



sequence artificielle : sonde 



<400> 31 

gtcagacgct 

ccgacgggga 

acgttttaga 

cttcaagctg 

tgatgtcctg 

catcgaggaa 

ccagcggaac 

gcactggtac 



gacctggtgg 
gagttcatca 
gtcaagtttg 
agcgcccccc 
ggtcatgtta 
tgtacctccc 
ttcctgaagc 
caactgtgta 



tgttccttaa 
aggaaattaa 
aggtccagag 
atctgcatca 
atacttccag 

tggggaagga 

agcgcccaac 
aggagaagct 



caatctcacc 
gaaacagctg 
ttcatggtgg 
ggaggtggag 
caagcctgat 
tggcgagttc 
caagctgaag 



agctttgagg 
tacgaggttc 
cccaacgccc 
tttgatgtgc 
cccagaatct 
tctacctgct 
agtctcatcc 



atcagttaaa 60 
agcatgagag 120 
ggtctctgag 1 80 
tgccagcctt 240 
atgccatcct 300 
tcacggagct 360 
gcctggtcaa 4 20 



<210> 32 
<211> 497 
<21 2> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : sonde 
<400> 32 

acagtgcagg tgtgtgagcg tgtgtgtgcc catgacatgc gtgtgtgtct tcacggttca 60 
actagatgca tttagtgagc acttactaca tatgctacat gattcagatg ttcagcagtg 120 
gttagagcaa agcctaactg ctaggctttt tgatgcaagt tggattggga tccttccagg 180 
tctcttctta cacatacaca caagagagga cccttggttt cttctgccca' tgacccaaga 240 
cagattctag ccctgcccta tgacacagaa actattccct gccacacatg gacatgaaca 300 
ctgagactgt ggcctgtgct ctcaggtgcc cttgagtggc atcaacatgc aggctggggg 360 
cccataggta tgatgaaaat aaaaggtacc tggaattttg acacatgtaa ctttgaaaca 420 
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gggtcattgg tagcaacgat cagctttatc acatttagtt aaatcacaat gattgtggtt 480 
tcctttctga gacatga 497 
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